1. Aplicación de métodos de aprendizaje automático para la clasificación y la predicción
- Author
-
Universitat Politècnica de Catalunya. Departament de Matemàtiques, Buenestado Caballero, Pablo, Abascal Torrella, Marc, Universitat Politècnica de Catalunya. Departament de Matemàtiques, Buenestado Caballero, Pablo, and Abascal Torrella, Marc
- Abstract
El Machine Learning disposa de la tecnologia necessària per aplicar tècniques estadístiques i algoritmes a grans volums de dades, per tal d’entendre i respondre d’una manera automàtica a la informació. Aquesta tecnologia està essent cada cop més utilitzada per diferents empreses i sectors en aplicacions com el reconeixement facial o de la parla, l’anàlisi del comportament del consum o la productivitat i en la predicció del clima o el trànsit. En aquest projecte es mostra la relació de necessitat que manté la intel·ligència artificial amb l’ús de tècniques estadístiques, mitjançant la realització de dos estudis de classificació i un de regressió. En ells s’usen quatre algoritmes d’aprenentatge supervisat que requereixen tècniques estadístiques per obtenir classificacions i prediccions, i són: kernel-Nearest Neighbors, Naive Bayes, Decision Trees i Support Vector Machines. En els estudis, es determina que no tots els algoritmes presenten la mateixa precisió a l’hora de classificar i predir, i que aquests depenen de l’estructura i el format de les dades per adaptar-se i ajustar-se correctament al model. A més, es conclou que per aconseguir bons resultats, és necessari que el conjunt de dades disposi del nombre d’observacions necessàries en cadascuna de les classes perquè l’algoritme pugui entrenar-les profundament, i també, es percep que hi han classes que es classifiquen amb més facilitat que altres., El Machine Learning dispone de la tecnología necesaria para aplicar técnicas estadísticas y algoritmos a grandes volúmenes de datos con tal de entender y responder de una manera automática a la información. Esta tecnología está siendo cada vez más usada por diferentes empresas y sectores en aplicaciones como el reconocimiento facial o del habla, el análisis del comportamiento del consumo o la productividad y en la predicción del clima o del tráfico. En este proyecto se muestra la relación de necesidad que mantiene la inteligencia artificial con el uso de métodos estadísticos, mediante la realización de dos estudios de clasificación y uno de regresión. En ellos se utilizan cuatro algoritmos de aprendizaje supervisado que requieren técnicas estadísticas para obtener clasificaciones y predicciones, y son: kernel-Nearest Neighbors, Naive Bayes, Decision Trees y Support Vector Machines. En los estudios, se determina que no todos los algoritmos presentan la misma precisión a la hora de clasificar y predecir, y que estos dependen de la estructura y el formato de los datos para adaptarse y ajustarse correctamente al modelo. Además, se concluye que para obtener buenos resultados, es necesario que el conjunto de datos disponga del número de observaciones necesarias en cada clase para que el algoritmo pueda entrenarlas profundamente, y también, se observa que hay clases que se clasifican con más facilidad que otras., Machine Learning has the necessary technology to apply statistical techniques and algorithms to large volumes of data in order to understand and automatically respond to information. This technology is being increasingly used by different companies and sectors in applications such as facial recognition or speech, analysis of consumer behaviour or productivity, and weather or traffic prediction. In this project the relationship between artificial intelligence and the use of statistical techniques is shown through the execution of two classification studies and one regression study. Four supervised learning algorithms that require statistical techniques to obtain classifications and predictions are used: kernel-Nearest Neighbors, Naive Bayes, Decision Trees and Support Vector Machines. In the studies, it is determined that not all algorithms have the same accuracy in classifying and predicting, and that these depend on the structure and format of the data to adapt and fit correctly to the model. In addition, it is concluded that in order to obtain good results, the data set must have the necessary number of observations in each class so that the algorithm can train them deeply, and it is also perceived that there are classes that are classified more easily than others.
- Published
- 2023