Aquest és un projecte realitzat a la planta de producció d'ampolles de vidre buit Castellar Vidrio, del grup Vidrala. L'objectiu d'aquest projecte és crear un programa capaç de trobar la solució a certes defectuositats a les ampolles, amb la intenció que, en un futur, sigui capaç d'anticipar-se a l'aparició de defectuositats i avaries de màquina. Es pretén desenvolupar una base de dades, prenent totes les variables involucrades en el procés de producció de la línia CS23, per aplicar mètodes estadístics basats en Machine Learning i Data Analysis, amb la finalitat d'establir patrons entre les variables descriptives del procés per determinar el perquè de l'ocurrència de certs defectes a les ampolles. Per realitzar el programari es treballarà a R, un llenguatge de programació intuïtiu i eficaç que, mitjançant RStudio, un IDE (Entorn de Desenvolupament Integrat) específic per a R, ens permetrà tant programar els scripts relacionats amb la base de dades com els scripts relacionats amb l'aplicació de mètodes estadístics. El procés que se seguirà serà, primerament, aprendre a programar a R, mitjançant RStudio. Posteriorment, generarem la base de dades, reunint constantment informació dels múltiples entorns de dades de la línia de producció CS23. Un cop feta la base de dades, ens centrarem en crear un programari que ens permetrà aplicar els mètodes estadístics desitjats, utilitzant les variables d'interès de la base de dades. Finalment, resoldrem un cas real plantejat pels caps de l'empresa, on obtindrem les variables descriptives més destacades durant una defectuositat present en tota la producció d'una nit, on es conclourà que el projecte és funcional i es definiran les possibles millores futures. Este es un proyecto realizado en la planta de producción de botellas de vidrio hueco Castellar Vidrio, del grupo Vidrala. El objetivo de este proyecto consiste en crear un software capaz de encontrar la solución a ciertas defectuosidades en las botellas, con la intención de que, en un futuro, sea capaz de anticiparse a la aparición de defectuosidades y averías de máquina. Se pretende desarrollar una base de datos, tomando todas las variables involucradas en el proceso de producción de la línea CS23, para aplicar métodos estadísticos basados en Machine Learning y Data Analysis, con la finalidad de establecer patrones entre las variables descriptivas del proceso para determinar el porqué de la ocurrencia de ciertos defectos en las botellas. Para realizar el software se trabajará en R, un lenguaje de programación intuitivo y eficaz que, mediante RStudio, un IDE (Entorno de Desarrollo Integrado) específico para R, nos permitirá tanto programar los scripts relacionados con la base de datos como los scripts relacionados con la aplicación de métodos estadísticos. El proceso que se seguirá será, primeramente, aprender a programar en R, mediante RStudio. Posteriormente, generaremos la base de datos, reuniendo constantemente información de los múltiples entornos de datos de la línea de producción CS23. Una vez se haya realizado la base de datos, nos centraremos en crear un software que nos permitirá aplicar los métodos estadísticos deseados, usando las variables de interés de la base de datos. Finalmente, resolveremos un caso real planteado por los propios mandatarios de la empresa, donde obtendremos las variables descriptivas más influyentes en una defectuosidad presente durante toda la producción de una noche, donde se concluirá que el proyecto es funcional y se definirán las posibles mejoras futuras. This is a project developed at Castellar Vidrio, a glass bottle production plant from Vidrala group. The project focuses on CS23 production line, one of the newest and most sophisticated lines among the seven that the plant has. The aim of the project consists in creating a software The aim of the project consists in creating a software whose function is to find the solution to certain defects in the bottles, to machine breakdowns and to find the parameters that give the maximum stability to the production line. It is intended to develop a database, taking all the variables involved in the production process of the CS23 line, to apply statistical methods based on Machine Learning and Data Analysis, in order to establish patterns between the descriptive variables of the process to determine the reason for the occurrence of certain defects in the bottles. In order to develop the software, we will use R, an intuitive and effective programming language that, through RStudio, a specific IDE (Integrated Development Environment) for R, will allow us to program both the scripts related to the database and the scripts related to the application of statistical methods. The process that we will be following is, first of all, learn to program in R, through RStudio. Later, we will generate the database, constantly gathering information from the multiple data environments of interest from the CS23 production line. Once the database has been created, we will focus on creating software that will allow us to apply the desired statistical methods, using the variables of interest from the database. Finally, we will solve a real case raised by the company's own leaders, where we will obtain the most influential descriptive variables in a defectiveness that occurred during the entire production of one night, where it will be concluded that the project is functional and possible future improvements will be defined.