126 results on '"aprendizaje de máquina"'
Search Results
2. Calidad en el servicio hotelero: Propuesta de metodología experimental
- Author
-
Jaime Morales-Morales, Nadia Valdez Acosta, Jesús René Morales-Morales, and Arturo Yee-Rendón
- Subjects
calidad en el servicio ,indicadores de calidad ,propuesta experimental ,aprendizaje de máquina ,Commerce ,HF1-6182 ,Business ,HF5001-6182 - Abstract
La calidad en el servicio es una variable que tiene consigo un propósito subyacente que es la satisfacción del cliente, los indicadores de calidad en el servicio del sector hotelero han sido analizados en investigaciones múltiples. El artículo tiene como objetivo identificar los indicadores más significativos de la calidad en el servicio, se presenta una metodología experimental cuantitativa disruptiva que utiliza el aprendizaje de máquina, particularmente K-medias como técnica de aprendizaje no supervisado para agrupar el conjunto de datos que describe la calidad en el servicio. Los resultados del análisis estadístico demuestran que los indicadores más importantes fueron Asertividad y Aclaraciones del capital humano. El uso de nuevas metodologías contribuye a modelar aquellos indicadores de la calidad en el servicio hotelero y se promueve información multidisciplinar que pueden llegar a tener otros escenarios de información para tomar decisiones gerenciales en el sector hotelero.
- Published
- 2023
- Full Text
- View/download PDF
3. Sistema inteligente conversacional aplicado a la gobernanza local
- Author
-
Franco Brandan, Andrea Villagra, and Daniel Pandolfi
- Subjects
Aprendizaje de máquina ,Inteligencia Artificial ,Chatbot ,Sistemas Inteligentes Conversacionales ,General Works - Abstract
En la actualidad, la tecnología se ha convertido en una herramienta imprescindible para mejorar la calidad de vida de las personas y facilitar el desarrollo de las ciudades y comunidades. En este contexto, los sistemas inteligentes conversacionales, también conocidos como chatbots, han adquirido una gran importancia en múltiples campos de las novedosas “ciudades inteligentes”. Aunque simple en apariencia, una aplicación de mensajería con la capacidad de sostener un gran número de conversaciones con sus usuarios, que puede mantener un flujo de información mayor que cualquier otra herramienta utilizada hasta el momento, es de inmenso interés para entidades públicas y privadas. Utilizando tecnologías de Inteligencia Artificial (IA), redes neuronales recurrentes y aprendizaje de máquina, puede analizar enormes volúmenes de datos, comprender intenciones y comportamientos para ofrecer las respuestas correctas a cualquier usuario estudiando su contexto. En el presente artículo se describe el trabajo realizado para aplicar la tecnología de los sistemas inteligentes en la creación de un asistente virtual orientado a la Oficina de Empleo local de Caleta Olivia. Se realiza un estudio de los conceptos de procesamiento de lenguaje natural, análisis de modelos de lenguaje y de redes neuronales, para la creación del chatbot capaz de resolver consultas y entregar la información solicitada a cualquier posible ciudadano que desee interactuar con esta oficina de empleo. Todo esto teniendo en cuenta el uso de un lenguaje natural, sencillo y fácil de comprender, personalizado y accesible, competente en la detección de intenciones poco claras y un alto nivel de expansión con auto aprendizaje.
- Published
- 2023
- Full Text
- View/download PDF
4. Estimaciones trimestrales de pobreza multidimensional en México mediante algoritmos de aprendizaje de máquina
- Author
-
Ratzanyel Rincón
- Subjects
pobreza multidimensional ,aprendizaje de máquina ,regresión logística de LASSO ,Economic growth, development, planning ,HD72-88 ,Economic history and conditions ,HC10-1085 ,Economics as a science ,HB71-74 - Abstract
Este artículo aborda la falta de información oportuna sobre la pobreza multidimensional en México. Tres algoritmos de aprendizaje de máquina —la regresión LASSO logística, el bosque aleatorio y las máquinas de vectores de soporte— son entrenados con la ENIGH para encontrar patrones generalizables de pobreza multidimensional en los datos. Los modelos se utilizan para clasificar a cada individuo en la ENOE como pobre o no-pobre para obtener tasas de pobreza trimestrales. Estas estimaciones son más cercanas a los niveles de pobreza multidimensional que la pobreza laboral y brindan una perspectiva precisa sobre la pobreza con más de un año de antelación a la medición oficial.
- Published
- 2022
- Full Text
- View/download PDF
5. Horno cementero rotatorio: una revisión al control mediante sistemas expertos
- Author
-
José Luis Castillo Tirado, Manuel Alejandro Ospina Alarcón, and Paula Andrea Ortiz Valencia
- Subjects
aprendizaje de máquina ,eficiencia energética ,horno cementero ,inteligencia artificial ,sistemas expertos ,Technology ,Engineering (General). Civil engineering (General) ,TA1-2040 - Abstract
Este artículo presenta una revisión de investigaciones realizadas mediante diferentes estrategias de control aplicadas en hornos cementeros rotatorios, sistema donde se da la fabricación de clínker, material indispensable para la elaboración del cemento. Esta exploración menciona estudios que se han desarrollado desde los años ochenta hasta el presente, destacando en cada una la metodología de control utilizada, los beneficios obtenidos en el proceso y sus futuras aplicaciones, esto con el fin de brindar al lector una visión global del uso de técnicas de control para hornos cementeros rotatorios y de cómo los avances científicos, con el paso de los años, han contribuido a esta industria en la eficiencia y mejora de sus procesos productivos; por tanto, se mencionan aportes y métodos de control como sistemas expertos (SE), control predictivo basado en modelo (MPC), redes neuronales artificiales y lógica difusa. Al finalizar la mencionada revisión se infiere que tecnologías de inteligencia artificial y de la industria 4.0 que se tienen actualmente como la computación en la nube, el procesamiento de grandes volúmenes de datos, el uso de los gemelos digitales, la ejecución de algoritmos de aprendizaje automático (machine learning) y sus herramientas de predicción, junto con la aplicación de SE y demás técnicas de control mencionadas, permitirían realizar un control avanzado, que pueda responder de forma satisfactoria a las necesidades de producción actuales y ofrecer múltiples beneficios como el tiempo de respuesta del control, la estabilidad, y mejoras en producción y calidad del material en un horno rotatorio.
- Published
- 2022
- Full Text
- View/download PDF
6. Detección de fallas en vehículos aéreos no tripulados mediante señales de orientación y técnicas de aprendizaje de máquina
- Author
-
F. R. López-Estrada, A. Méndez-López, I. Santos-Ruiz, G. Valencia-Palomo, and E. Escobar-Gómez
- Subjects
vehículo aéreo no tripulado ,detección e identificación de fallas ,análisis en componentes principales ,aprendizaje de máquina ,cuadrirrotor ,Control engineering systems. Automatic machinery (General) ,TJ212-225 - Abstract
Este trabajo propone un esquema de detección y localización de fallas en los actuadores de un vehículo aéreo no tripulado (VANT) del tipo cuadrirrotor. Para ello, se considera un enfoque basado en datos haciendo uso de técnicas de aprendizaje de máquina. En este enfoque se construye un modelo implícito del sistema a través de la información proporcionada por los sensores del VANT. Primero, a través de un plataforma de vuelo de tipo giroscópica, se captan las vibraciones correspondientes a la orientación, posición angular y aceleración lineal cuando el vehículo se encuentra en vuelo estacionario en condiciones nominales. Estos datos se procesan mediante Análisis en Componentes Principales (PCA) para la extracción de características. Posteriormente, se induce una falla a los actuadores a través de un recorte en cada una de las hélices del VANT que ocasionan una reducción del empuje generado por los rotores. Estos datos se proyectan también al subespacio de componentes principales y se comparan con los datos nominales. Para discernir entre los datos nominales y los datos cuando el vehículo presenta falla, se emplea el estadístico T2 de Hotelling. Finalmente, el desarrollo se complementa con los algoritmos de clasificación de k-vecinos más cercanos (k-NN) y de máquina de vectores de soporte (SVM). Los resultados muestran una tasa de clasificación correcta del 89.6 % (k-NN) y 92.4 %(SVM) respectivamente para 423 conjuntos de datos de validación.
- Published
- 2021
- Full Text
- View/download PDF
7. Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal
- Author
-
Manuel Francisco Dulce Vanegas and Adam Beltrán Gómez
- Subjects
minería de texto ,text mining ,aprendizaje de máquina ,machine learning ,contratación estatal ,state’s procurement ,control fiscal ,fiscal control and surveillance ,Science ,Science (General) ,Q1-390 ,Social sciences (General) ,H1-99 - Abstract
Las entidades fiscalizadoras superiores, y en específico su ente rector, la Organización Internacional de las Entidades Fiscalizadoras Superiores (INTOSAI), han impulsado en los últimos cuatro años iniciativas encaminadas al uso de tecnologías y métodos para sus procesos de vigilancia y fiscalización que sean replicables y que generen resultados tangibles en el contexto fiscal. En este sentido, la Contraloría General de la República de Colombia viene fortaleciendo su infraestructura tecnológica y capacidades técnicas con mirar a mejorar y optimizar sus esfuerzos en cuanto a la vigilancia de los recursos de los colombianos. Aunque dicha tarea no es sencilla, esta entidad ha logrado detectar patrones de aquellos contratistas que acaparan la contratación estatal, logrando estar en diferentes sectores económicos sin tener probablemente la competencia técnica para cumplir el objeto contractual estipulado. A estos se les conoce en el ámbito de la Contraloría General como contratistas “multiobjeto”. En el presente artículo se muestra la construcción de un conjunto de datos de 1.998 registros etiquetado por expertos, que corresponden a contratos del sector educativo en Colombia. Con este instrumento se llevó a cabo el entrenamiento y las pruebas sobre un clasificador automático construido para los objetos contractuales a fin de detectar presuntos contratistas “multiobjeto”. Adicionalmente, se encontró que el mejor algoritmo de clasificación fue “Máquina de Soporte Vectorial Lineal”, con una exactitud de 84 %, el cual permitió finalmente listar por agrupamiento los presuntos contratistas de este tipo.
- Published
- 2021
- Full Text
- View/download PDF
8. Sistema de monitoreo de conductores de vehículos a partir de análisis de expresiones faciales
- Author
-
Juan Felipe Cordoba Fuzga, Ruben Dario Vasquez Salazar, and Henry Omar Sarmiento Maldonado
- Subjects
expresiones faciales ,inteligencia artificial ,aprendizaje de máquina ,aprendizaje profundo ,visión artificial ,Engineering (General). Civil engineering (General) ,TA1-2040 - Abstract
Introducción-Al conducir, la persona se encuentra expuesta a diferentes estímulos que pueden llevar a que se ocasione accidentes. Aunque Numerosas propuestas tecnológicas se han presentado para mantener monitoreado al conductor, estas han pasado por alto el estado anímico en el que este se encuentra, el cual podría generar efectos negativos en la capacidad de reacción al conducir. Objetivo- Buscar diferentes alternativas de inteligencia artificial para el análisis permanente de rostros de conductores, con el fin de encontrar un buen modelo de clasificación de expresión facial (feliz, enojo, sorpresa, neutral). Metodología- La metodología utilizada consiste en la selección de una base de datos que es preprocesada, para posteriormente entrenar diferentes modelos y realizar comparaciones de precisión entre ellos. Resultados- Se logra encontrar una precisión mayor al 80% en la detección del estado anímico del usuario. Y se logra migrar el modelo a un sistema de monitoreo portátil. Conclusiones- En este caso particular los métodos de aprendizaje de maquina tradicionales (machine learning) consumen menos tiempo a la hora de clasificar, sin embargo, estos son superados en precisión por un aprendizaje profundo.
- Published
- 2020
- Full Text
- View/download PDF
9. Modelo computacional para reconocimiento de lenguaje de señas en un contexto colombiano
- Author
-
Nelson Ortiz-Farfán and Jorge E. Camargo-Mendoza
- Subjects
personas sordas ,aprendizaje de maquina ,modelo computacional ,lenguaje de señas ,Technology ,Engineering (General). Civil engineering (General) ,TA1-2040 - Abstract
Este documento presenta la implementación de un software de reconocimiento de lenguaje de señas colombiano para personas sordas. Para este propósito, el Aprendizaje de Máquina será usado como base del sistema específico. Hoy en día no existe un repositorio público de imágenes o video que contenga estas señas ni la información necesaria para alcanzar esta meta, siendo uno de los principales impedimentos para iniciar la tarea. Por esta razón, se comenzó con la construcción de un repositorio. Pese a las dificultades de tiempo de los participantes, cinco personas realizaron las señas ante una cámara de video, de donde se obtuvieron las imágenes que compondrían el repositorio. Una vez hecho esto, las imágenes se usaron como datos de entrenamiento de un modelo computacional óptimo que puede predecir el significado de una nueva imagen presentada. Evaluamos el rendimiento del método utilizando medidas de clasificación y comparando diferentes modelos. La medición conocida como Accuracy fue un factor importante para medir los diferentes modelos obtenidos y así elegir el más adecuado. Los resultados muestran que es posible proporcionar nuevas herramientas a las personas sordas para mejorar la comunicación con otras personas que no conocen el lenguaje de señas. Una vez que se han elegido los mejores modelos, se prueban con nuevas imágenes, similares a las del entrenamiento, donde se puede ver que el mejor modelo logra una tasa de éxito de alrededor del 68 % de las 22 clases utilizadas en el sistema.
- Published
- 2020
- Full Text
- View/download PDF
10. Algoritmos de aprendizaje de máquina para la predicción de propiedades fisicoquímicas del suelo mediante información espectral: una revisión sistemática
- Author
-
Mateo Vargas-Zapata, Marisol Medina-Sierra, Luis Fernando Galeano-Vasco, and Mario Fernando Cerón-Muñoz
- Subjects
algoritmos de predicción ,aprendizaje de máquina ,análisis químico ,espectroscopía ,Social Sciences ,Industries. Land use. Labor ,HD28-9999 ,Management. Industrial management ,HD28-70 ,Technological innovations. Automation ,HD45-45.2 - Abstract
En la literatura científica actual se discute ampliamente acerca de la predicción de propiedades edáficas mediante información espectral. El objetivo de esta revisión fue encontrar algoritmos con el mayor potencial predictivo para las propiedades fisicoquímicas del suelo, basados en información espectral capturada con diferentes instrumentos. Se realizó una revisión sistemática en la cual se encontraron 121 artículos de los cuales se eligieron 19, que cumplieran con un coeficiente de determinación mayor a 0,80 o una raíz del error cuadrado medio cercana a 0. Se determinó que el rango espectral más utilizado corresponde al rango desde 350 hasta 2500 nm; los algoritmos mínimos cuadrados parciales, máquina de soporte vectorial y máquina de soporte vectorial ajustado son adecuadas para predecir pH, materia orgánica y carbono orgánico. Además, la regresión lineal solo es efectiva para predecir el carbonato de calcio, materia orgánica, humedad y contenido de agua mediante bandas individuales.
- Published
- 2022
- Full Text
- View/download PDF
11. DESARROLLO DEL ESTADO DEL ARTE EN INVESTIGACIÓN: UNA HERRAMIENTA BASADA EN INTELIGENCIA ARTIFICIAL
- Author
-
Víctor Andrés Bucheli Guerrero
- Subjects
estado del arte ,aprendizaje de máquina ,visualización ,reconocimiento de patrones ,investigación ,Technology ,Science - Abstract
El trabajo describe el proceso semi-asistido de desarrollo del estado del arte en investigación. Así, se presenta un prototipo de software basada en inteligencia artificial, un estudio de caso de un proyecto de doctorado y los resultados de una encuesta llevada a cabo a 40 estudiantes de maestría y doctorado, quienes reportan la utilidad de la herramienta. En el documento se presenta la arquitectura, la implementación del prototipo de software y un estudio comparativo con las herramientas existentes. Se discuten las potencialidades del proceso asistido por la herramienta y el impacto positivo que puede tener en la investigación, principalmente en el contexto colombiano. Así también se discuten las técnicas de inteligencia artificial implementadas, la escalabilidad de la herramienta y la facilidad de integrar nuevos análisis y visualizaciones.
- Published
- 2019
- Full Text
- View/download PDF
12. Diseño y simulación de un control neuronal aplicado a un convertidor flyback para la regulación de tensión
- Author
-
Óscar Eduardo López-Manchola, Juan David Gómez-Buitrago, Andrés Eduardo Gaona-Barrera, and Nelson Leonardo Díaz-Aldana
- Subjects
Aprendizaje de máquina ,control inteligente ,convertidor flyback ,red neuronal ,regulador de tensión ,Simulink ,Technology ,Engineering (General). Civil engineering (General) ,TA1-2040 - Abstract
Este artículo presenta el diseño y simulación de un controlador basado en redes neuronales para regular la tensión de salida de un convertidor flyback. Se usan redes neuronales, ya que estas no requieren de un modelo matemático del convertidor, y, por tanto, se obtiene un mayor rango de operación respecto a métodos de control tradicional. En el entrenamiento se realizan cambios en la base de datos y en la arquitectura para obtener el controlador más apropiado, que garantice la regulación de línea y carga del convertidor. La validación del controlador neuronal funcional se realiza en Simulink con el modelo circuital de un convertidor flyback, sometiéndolo a cambios en la tensión de entrada y en la carga resistiva. Los resultados obtenidos muestran la efectividad del control neuronal para la regulación de línea entre 20 V y 50 V, regulación de carga entre 8 Ω y 12 Ω, y cuya arquitectura está conformada por cuatro neuronas.
- Published
- 2021
13. Sistema automático de clasificación de peces
- Author
-
Robinson Jiménez Moreno, Javier Eduardo Martínez Baquero, and Luis Alfredo Rodríguez Umaña
- Subjects
aprendizaje de máquina ,aprendizaje profundo ,reconocimiento de patrones ,clasificación de peces ,visión de máquina ,rnc ,Electrical engineering. Electronics. Nuclear engineering ,TK1-9971 - Abstract
el presente artículo expone el diseño de una arquitectura de red para reconocimiento de patrones orientada a la clasificación automática de dos tipos de peces: mojarra y tilapia. Se emplea una arquitectura basada en aprendizaje profundo mediante una red neuronal convolucional (RNC) para la cual se determina la base de datos a emplear y los diferentes hiperparámetros que la componen. Se logra obtener, mediante análisis por matriz de confusión, un desempeño del 100% de la red bajo las condiciones controladas el sistema de clasificación, es decir: color de banda transportadora uniforme y uso de luz día.
- Published
- 2018
- Full Text
- View/download PDF
14. Separación de fuentes auditivas para pedagogía musical
- Author
-
Randy Darrell Lancheros-Molano, Juan Sebastián Triana-Perez, Juan Felipe Castañeda-Chaparro, Felipe Andrés Gutiérrez-Naranjo, and Andrea del Pilar Rueda-Olarte
- Subjects
Aprendizaje de máquina ,Separación de fuentes auditivas ,Generación de partituras ,Aplicación web ,Computer engineering. Computer hardware ,TK7885-7895 ,Electronic computers. Computer science ,QA75.5-76.95 - Abstract
Harmonics espera apoyar a la pedagogía musical, ofreciendo un producto concreto con el cual los interesados en aprender a tocar un instrumento puedan practicar. Se entrenó un modelo para identificar y aislar las pistas singulares de una canción, por medio de TensorFlow y herramientas para realizar la separación de fuentes auditivas y producir partituras genuinas, basadas en un algoritmo de transcripción musical (para pianos, bajos, batería y voz, específicamente), que los principiantes puedan visualizar, editar y descargar (en formatos .PDF y .MIDI), ajustándose a su ritmo de práctica. Se consideraron tres métodos de separación de fuentes, bajo las siguientes restricciones: emplear una única canción como archivo de entrada, que ésta fuera moderadamente compleja (compuesta por un conjunto de entre tres y seis instrumentos) y que la cantidad de muestras –canciones compuestas por instrumentos relevantes y pistas de cada instrumento por separado– aptas para el entrenamiento del modelo, sean sumamente escasas.
- Published
- 2021
- Full Text
- View/download PDF
15. Aplicaciones de las redes neuronales y el deep learning a la ingeniería biomédica
- Author
-
José Luis Sarmiento-Ramos
- Subjects
aprendizaje de máquina ,inteligencia artificial ,reconocimiento de patrones ,ómica ,bioinformática ,biomedicina ,Technology ,Engineering (General). Civil engineering (General) ,TA1-2040 - Abstract
Hoy en día, las redes neuronales artificiales y el deep learning, son dos de las herramientas más poderosas del aprendizaje de máquina, que tienen por objetivo desarrollar sistemas que aprenden automáticamente, reconocen patrones, predicen comportamientos y generalizan información a partir de conjuntos de datos. Estas dos herramientas se han convertido en un potencial campo de investigación con aplicaciones a la ingeniería, no siendo la ingeniería biomédica la excepción. En este artículo se presenta una revisión actualizada de las principales aplicaciones de las redes neuronales y el deep learning a la ingeniería biomédica en las ramas de la ómica, la imagenología, las interfaces cerebro-máquina y hombre-máquina, y la gestión y administración de la salud pública; ramas que se extienden desde el estudio de procesos a nivel molecular, hasta procesos que involucran grandes poblaciones.
- Published
- 2020
16. Red neuronal convolucional para discriminar herramientas en robótica asistencial
- Author
-
Robinson Jiménez Moreno, Oscar Avilés, and Diana Marcela Ovalle
- Subjects
aprendizaje de máquina ,aprendizaje profundo ,reconocimiento de patrones ,rnc ,robótica asistencial ,visión de máquina ,Electrical engineering. Electronics. Nuclear engineering ,TK1-9971 - Abstract
En el presente artículo se expone el entrenamiento de una Red Neuronal Convolucional (RNC) para discriminación de herramientas de uso común en tareas de mecánica, electricidad, carpintería y similares. Para el caso, se toman como objetivos de entrenamiento pinzas, destornilladores, tijeras y alicates, los cuales puedan ser identificados por la red, y permite dotarle a un brazo robótico la facultad de identificar una herramienta deseada - de entre las anteriores - para su posible entrega a un usuario. La arquitectura neuro convolucional empleada para la red presenta un porcentaje de acierto del 96% en la identificación de las herramientas entrenadas.
- Published
- 2018
- Full Text
- View/download PDF
17. DESCRIPTORES ESPACIO-FRECUENCIA PARA IDENTIFICACIÓN AUTOMÁTICA DE PATRONES DE TEXTURA EN PRODUCTOS TEXTILES UTILIZANDO APRENDIZAJE SUPERVISADO
- Author
-
Arley Bejarano Martínez, Andrés Felipe Calvo Salcedo, and Carlos Alberto Henao Baena
- Subjects
análisis de textura ,aprendizaje de máquina ,segmentación fractal ,textiles ,tiempo frecuencia ,transformada de fourier ,Engineering (General). Civil engineering (General) ,TA1-2040 ,Science - Abstract
En este artículo se presenta una evaluación de descriptores espacio frecuencia y técnicas de análisis de texturas para la clasificación de textiles. La metodología de trabajo consta de tres etapas fundamentales: la caracterización, la clasificación y la validación. En la etapa de caracterización se utilizan descriptores como la Transformada Wavelet, la Transformada de Fourier, un método de caracterización de textura del estado del arte como lo es segmentación fractal para el análisis de texturas (SFTA) y la adaptación de la transformada corta de Fourier en espacio. Para la etapa de clasificación se analiza el uso de tres métodos del estado del arte, como lo son las Redes Neuronales Artificiales (RNA), Máquinas de Soporte Vectorial (SVM) y el Proceso Gaussiano (GP), a estos dos últimos se les incluyeron el uso de kernels lineales, Gaussianos y polinomiales. Para validar el método se construye una base de datos anotada con diez tipos de telas, con un total de 1.000 fotos, a las cuales se les aplica el proceso caracterización y clasificación por medio de un experimento Montecarlo. En esta etapa se generan configuraciones aleatorias de entrenamiento (70 %) y prueba (30 %), obteniendo el desempeño de cada modelo de clasificación. Por último, se obtiene la matriz de confusión y se determinan los porcentajes de acierto de cada experimento, adicionalmente se realiza un análisis de tiempos para cada uno de los algoritmos, tanto a nivel de descriptor como a nivel de clasificador, con el fin de determinar la configuración que mejores prestaciones presenta y su costo computacional.
- Published
- 2018
- Full Text
- View/download PDF
18. MVS en la alineación estática de prótesis transtibiales
- Author
-
Lely Adriana Luengas, Henry A. Hernandez M., and Daissy Carola Toloza Cano
- Subjects
alineación de prótesis ,aprendizaje de máquina ,modelo de simulación ,rehabilitación médica ,Electronic computers. Computer science ,QA75.5-76.95 ,Computer software ,QA76.75-76.765 - Abstract
El uso de prótesis es uno de los métodos de rehabilitación más utilizados por personas con amputación. En el caso de un amputado transtibial se hace uso de prótesis transtibial. Para lograr el adecuado ajuste entre la prótesis y la persona, se realiza la alineación de la prótesis, esto permitirá al sujeto amputado tener estabilidad, confort, adecuada distribución de fuerzas y momentos, igualdad ipsi y contralateral, entre otros. La alineación estática tiende a ser subjetiva, es realizada de forma observacional por personal experto en el tema. La presente investigación muestra una propuesta para realizar la alineación estática de forma objetiva, toma como base la distribución de presión sobre la superficie plantar y la ubicación del Centro de Presión (COP). Con el uso de sistemas de aprendizaje de máquina, como la máquina de soporte vectorial (SVM), y las variables biomecánicas nombradas se generó una herramienta computacional que da a conocer si existe alineación de la prótesis. Se obtuvo un rendimiento cercano al 100% con el modelo propuesto. Se comprueba que con el uso de recursos tecnológicos en el área de rehabilitación de amputados se puede realizar de forma objetiva la alineación estática de prótesis transtibiales
- Published
- 2017
- Full Text
- View/download PDF
19. Técnicas de aprendizaje de máquina utilizadas para la minería de texto
- Author
-
Ángel Freddy Godoy Viera
- Subjects
aprendizaje de máquina ,minería de texto ,técnicas de aprendizaje de máquina ,Bibliography. Library science. Information resources ,Bibliography ,Z1001-8999 - Abstract
Las técnicas de aprendizaje de máquina continúan siendo muy utilizadas para la minería de texto. Para este artículo se realizó una revisión de literatura en periódicos científicos publicados en los años de 2010 y 2011, con el objetivo de identificar las principales formas de aprendizaje de máquina empleadas para la minería de texto. Se utilizó estadística descriptiva para organizar, resumir y analizar los datos encontrados, y se presentó una descripción resumida de las principales encontradas. En los artículos analizados se hallaron 13 aplicadas para la minería de texto, el 83% de los artículos mencionaban de 1 a 3 técnicas de aprendizaje de máquina, las principales usadas por los autores en los artículos estudiados fueron support vector machine (svm), k-means (k-m), k-nearest neighbors (k-nn), naive bayes (nb), self-organizing maps (som). Los pares que aparecen con mayor frecuencia son svm/nb, svm/k-nn, svm/decission tree.
- Published
- 2017
- Full Text
- View/download PDF
20. Music software prototype with ML-based feedback system for initial keyboard learning as an alternative method for children
- Author
-
Borja Acevedo, Miguel Angel and Camargo Mendoza, Jorge Eliécer
- Subjects
607 - Educación, investigación, temas relacionados [600 - Tecnología (Ciencias aplicadas)] ,Música para instrumento de teclado ,Decision trees ,Piano ,Mobile app ,Musical keyboard ,Software musical ,Árboles de decisión ,Music learning ,786 - Teclado, mecánico, electrofónico, instrumentos de percusión [780 - Música] ,Música-enseñanza ,Aplicación móvil ,Teclado musical ,Music - Instruction and study ,Machine learning ,Music software ,Aprendizaje de máquina ,Keyboard music ,Aprendizaje musical - Abstract
ilustraciones, fotografías a color Según se evidencia en la literatura, la música ha acompañado al ser humano durante milenios, en diferentes situaciones, emociones y actividades. Además, no solo permite expresiones de los estados y sentimientos personales internos, sino que también puede llegar a producir muchos efectos positivos en quienes la practican. (Texto tomado de la fuente) Diversos autores han explorado estos beneficios que trae consigo la actividad musical, principalmente en los niños/niñas. Ellos resaltan aspectos positivos del aprendizaje de la música en diferentes áreas del conocimiento, en el rendimiento escolar e incluso, mejoras en el coeficiente intelectual de los infantes. Sin embargo, a pesar de la gran cantidad de estudios frente a los beneficios de la música en los niños/niñas y las distintas alternativas de enseñanza nacientes, en Colombia la situación sigue siendo dramática en cuanto a la incorporación de la actividad musical en el currículo escolar. Lo anterior agregado a factores políticos, espacios de enseñanza y formación docente. Con lo anterior, este trabajo ofrece una nueva alternativa de aprendizaje musical, dirigido a niños/niñas de 7 a 11 años, por medio de un software musical enfocado en la enseñanza inicial del teclado instrumental. Es importante mencionar que el software cuenta con un sistema de retroalimentación basado en árboles de decisión, el cual permite reforzar los temas cubiertos en la aplicación. Finalmente, se presenta un análisis comparativo entre la enseñanza empleando el software y la enseñanza tradicional con el libro, por medio de una Investigación-Acción realizada durante seis días a dos estudiantes de un colegio público de la ciudad de Bogotá, Colombia. Esta Investigación-Acción permitió observar resultados positivos basados en los comentarios y desempeños de los participantes, lo que abre una gran posibilidad para el escalamiento posterior de esta aplicación. As evidenced in the literature, music has accompanied the human being for millennia, in different situations, emotions and activities. In addition, not only does it allow expressions of internal personal states and feelings, but it can also produce many positive effects in those who practice it. Various authors have explored these benefits that musical activity brings, mainly in children. They highlight positive aspects of learning music in different areas of knowledge, in school performance and even improvements in the IQ of infants. However, despite the large number of studies regarding the benefits of music in children and the different nascent teaching alternatives, in Colombia the situation continues to be dramatic in terms of the incorporation of musical activity in the school curriculum. The foregoing added to political factors, teaching spaces and teacher training. With the above, this work offers a new musical learning alternative, aimed at children from 7 to 11 years old, through a musical software focused on the initial teaching of the instrumental keyboard. It is important to mention that the software has a feedback system based on decision trees, which allows reinforcing the topics covered in the application. Finally, a comparative analysis is presented between teaching using the software and traditional teaching with the book, through an Investigation-Action carried out over six days with two students from a public school in the city of Bogotá, Colombia. This Investigation-Action allowed to observe positive results based on the comments and performance of the participants, which opens a great possibility for the subsequent scaling of this application. Posterior a la bibliografía se encuentra el material suplementario, en el cual se encuentran los contenidos de la aplicación móvil desarrollada y descrita en el documento. Maestría Magíster en Ingeniería de Sistemas y Computación Computación aplicada Computación aplicada
- Published
- 2023
21. Genomic Prediction and Genome-Wide Association Analysis in Common Bean (Phaseolus vulgaris l.) × Tepary bean (P. acutifolius a. gray) Inter-specific Advanced Lines at the Caribbean Coast of Colombia
- Author
-
López Hernández, Luis Felipe, Villanueva Mejía, Diego Fernando, and Cortés Vera, Andrés Javier
- Subjects
Phaseolus ,Genomic prediction ,Bayesiano ,Bioinformatics ,PROPIEDADES BIOLÓGICAS ,Modeling ,Bioinformática ,Modelamiento ,GENOMAS ,artificial intelligence ,Bayesian ,Inteligencia artificial ,VALOR GENÉTICO ,Computational biology ,Predicción genómica ,Mejoramiento genético ,Machine learning ,Biología computacional ,Aprendizaje de máquina ,GWAS ,CIENCIAS DE LA VIDA - Abstract
Los efectos negativos del cambio climático están poniendo en riesgo la seguridad alimentaria mundial con 828 millones de personas pasando hambre, casi 16 veces la población de Colombia. Ante este escenario, las leguminosas como el frijol común han ofrecido una solución basada en la naturaleza como fuente de alimento para las comunidades rurales de América Latina gracias a su alto contenido de nutrientes. Por ello, es imperativo acelerar el mejoramiento genético molecular del frijol común para que pueda ser cultivado en regiones afectadas por el cambio climático extremo, una de las cuales es la costa colombiana. Por lo tanto, para cerrar esta brecha, este estudio tuvo como objetivo acoplar un panel avanzado de líneas interespecíficas de frijol común (Phaseolus vulgaris L.) × frijol tepary (P. acutifolius A. Gray) con algoritmos de regresión bayesianos para identificar nuevas fuentes de adaptación. a las subregiones húmedas y secas de la costa caribeña de Colombia, donde el frijol común presenta típicamente una mala adaptación a las olas de calor extremo. Se genotiparon mediante secuenciación (GBS) un total de 87 líneas avanzadas con ancestros interespecíficos, lo que condujo al descubrimiento de 15 645 marcadores de polimorfismo de un solo nucleótido (SNP). Se registraron tres componentes de rendimiento y dos variables de biomasa para cada genotipo y se ingresaron en varios modelos de regresión bayesiana para identificar los principales genotipos con los mejores valores de mejoramiento genético en tres localidades de la costa de Colombia. Exploramos el análisis comparativo de varios enfoques de regresión donde el modelo con el mejor desempeño en todos los rasgos y entornos fue BayesC. Además, comparamos la utilización de todos los marcadores y solo aquellos determinados como asociados por modelos GWAS a priori. Una mejor capacidad de predicción con el conjunto completo de SNP fue indicativa de falta de heredabilidad como parte de las reconstrucciones de GWAS. Además, los conjuntos de SNP óptimos por entorno y característica se determinaron en los 500 marcadores más explicativos de acuerdo con sus efectos de regresión β. Estos 500 SNP se superpusieron en promedio en un 5,24 % entre localidades, lo que reforzó la naturaleza ambientalmente dependiente de la adaptación poligénica. Finalmente, recuperamos los valores genéticos estimados genómicos (GEBV) y seleccionamos los 10 genotipos principales para cada entorno y rasgo como parte de un esquema de recomendación dirigido a la adaptación estrecha. Los genotipos y marcadores SNP identificados en este estudio como candidatos para el estrés abiótico tienen el potencial de ser utilizados en los siguientes ciclos como parte del programa de mejoramiento de frijol a largo plazo para las regiones tropicales costeras., The negative effects of the climate change are risking global food security with 828 million people facing hunger, which is almost 16 times the population of Colombia. Given this scenario, legumes as common bean has offered a nature-based solution to source nutrients for rural communities in Latin America thanks to their high content of nutrients. For this reason, it is imperative to speed up the molecular genetic breading of common beans so that they can be cultivated in regions affected by extreme climate change, one of which is coastal Colombian. Therefore, in order to bridge this gap, this study aimed coupling an advanced panel of common bean (Phaseolus vulgaris L.) × tepary bean (P. acutifolius A. Gray) inter-specific lines with Bayesian regression algorithms to identify novel sources of adaptation to the humid and dry sub-regions at the Caribbean coast of Colombia, where common bean typically exhibits maladaptation to extreme heat waves. A total of 87 advanced lines with inter-specific ancestries were genotyped by sequencing (GBS), leading to the discovery of 15,645 single-nucleotide polymorphism (SNP) markers. Three yield components and two biomass variables were recorded for each genotype and inputted in several Bayesian regression models to identify the top genotypes with the best genetic breeding values across three localities in coastal Colombia. We explored the comparative analysis of several regression approaches where the model with the best performance in all traits and environments was BayesC. Also, we compared the utilization of all markers and only those determined as associated by a priori GWAS models. Better prediction ability with the complete SNP set was indicative of missing heritability as part of GWAS reconstructions. Furthermore, optimal SNP sets per environment and trait were determined to the top 500 most explicative markers according to their β regression effects. These 500 SNPs on average overlapped in 5.24 % across localities, which reinforced the environmentally dependent nature of polygenic adaptation. Finally, we retrieved the genomic estimated breeding values (GEBVs), and selected the top 10 genotypes for each environment and trait as part of a recommendation scheme targeting narrow adaption. The genotypes and SNP markers identified in this study as candidates for abiotic stress have the potential to be used in the following cycles as part of the long-term bean breeding program for coastal tropical regions.
- Published
- 2023
22. Calibration analysis in quantum machine learning models
- Author
-
Amaya Cruz, Glenn Harry, Gonzalez Osorio, Fabio Augusto, Toledo Cortés, Santiago, and Mindlab
- Subjects
Calibración ,Aprendizaje de máquina cuántico ,629 - Otras ramas de la ingeniería [620 - Ingeniería y operaciones afines] ,Teoría del campo cuántico ,Confident analysis ,Evaluación de riesgos ,Quantum field theory ,Machine learning ,Calibration ,Aprendizaje de máquina ,Análisis de confianza ,621 - Física aplicada [620 - Ingeniería y operaciones afines] ,Quantum machine learning ,Risk assessment - Abstract
El análisis de calibración de modelos de aprendizaje de máquina cobra gran importancia en distintos contextos como evaluación del riesgo, diagnósticos y sistemas críticos para la seguridad, donde hay decisiones influenciadas por las predicciones de los modelos. El área del aprendizaje de máquina cuántico ha recibido una mayor atención en los últimos años, en particular, se han desarrollado modelos que obtienen resultados competitivos en tareas de clasificación y regresión a comparación con métodos ampliamente utilizados. No obstante, las propiedades de este tipo de clasificadores en términos de calibración no han sido exploradas en la literatura. Por esta razón, en el presente trabajo se realiza un estudio de las propiedades de calibración que tienen algunos modelos de aprendizaje de máquina cuántico frente a modelos ampliamente usados en la literatura como máquinas de soporte vectorial, árboles de decisión, regresión logística, entre otros para tareas de clasificación binaria y de múltiples clases. Adicionalmente, se realiza un experimento para explorar el efecto de algunos clasificadores cuánticos en combinación con una red neuronal. Los resultados experimentales muestran que algunos de los clasificadores cuánticos analizados tienen un rendimiento competitivo e incluso mejor en métricas de calibración y las tareas de clasificación. (texto tomado de la fuente) Calibration of machine learning models is of great importance in different contexts such as risk assessment, diagnostics, and safety-critical systems, in which decisions are influenced by model predictions. The area of quantum machine learning has received an increased attention in recent years, in particular, models have been developed that obtain competitive results in classification and regression tasks compared to widely used methods. However, the properties of this type of classifiers in terms of calibration have not been explored in the literature. As a result, in this work a study of the properties of calibration is conducted for recent quantum machine learning models in comparison to state-of-the-art models such as support vector machines, decisions trees, logistic regression, and others for binary and multiclass classification tasks. Moreover, an experiment to explore the effect of some quantum classifiers in combination with a neural network is made. The experimental results show that some of the analyzed quantum classifiers have competitive and even better performance in calibration metrics and the classification tasks. Maestría Magíster en Ingeniería - Ingeniería de Sistemas y Computación Sistemas Inteligentes
- Published
- 2023
23. Allocation of revolving credit limit applied to new customers of a Colombian fintech
- Author
-
Medina González, Camilo Ernesto, Gomez Jaramillo, Francisco Albeiro, and Computational Modeling of Biological Systems Research Group - COMBIOS
- Subjects
Machine Learning ,Credit ,ADMINISTRACION DE CREDITOS ,MICROFINANZAS ,Credit management ,Aprendizaje de máquina ,Microfinance ,519 - Probabilidades y matemáticas aplicadas [510 - Matemáticas] ,Finanzas ,Credit allocation ,Asignación de cupo ,Finance ,Crédito - Abstract
ilustraciones, graficas La asignación de cupos de crédito es uno de los grandes problemas a los que se enfrenta la industria financiera en Colombia actualmente. Esta tesis propone un nuevo modelo de asignación de cupos de crédito mediante la extracción de información financiera relevante de los registros históricos de solicitudes de crédito y estrategias de aprendizaje de máquina. En particular, se propone estimar directamente el segmento de cupo de crédito a partir de información económica, sociodemográfica y de riesgo crediticio de los clientes, en contraste con modelos previos que abordan el problema en dos pasos: 1) estimando la probabilidad de incumplimiento, y seguidamente, 2) el cupo de crédito con optimización. La información para ajustar los modelos de aprendizaje es extraída de históricos de aprobaciones de créditos realizadas por expertos. Seguidamente, modelos de clasificación multiclase son entrenados y comparados para resolver la tarea de asignación directa de cupos de crédito en segmentos. El modelo fue evaluado en datos crediticios de una entidad financiera colombiana en la tarea de asignación de cupos en microcréditos. Los resultados sugieren que el modelo propuesto supera los desempeños en asignación respecto a modelos lineales del estado del arte y presenta bajos niveles de sesgo. Se espera que este modelo de asignación de cupo pueda ser utilizado para la automatización de los procesos de originación de microcréditos, generando un impacto positivo en el acceso a los servicios financieros. (Texto tomado de la fuente) Currently, the allocation of credit quotas is one of the major problems facing the financial industry in Colombia. Therefore, this dissertation proposes a new credit quota allocation model by extracting relevant financial information from historical credit application records and machine learning strategies. Indeed, it is suggested to directly estimate the credit quota segment from customers' economic, sociodemographic, and credit risk information, in contrast to previous models that tackle the problem in two steps: firstly, 1) by estimating the probability of default, and secondly, 2) by optimizing the credit quota. Thus, the information to fit the learning models is extracted from historical credit approvals by experts. Subsequently, multi-class classification models are trained and compared to solve the task of direct assignment credit quotas in segments. Finally, the model was evaluated in credit data from a Colombian financial institution in assigning microcredit quotas. The results suggest that the proposed model outperforms state-of-the-art linear models and presents low bias levels. Eventually, it is expected that this quota allocation model can be used to automate the microcredit origination processes, generating a positive impact on access to financial services. Maestría Magíster en Ciencias - Matemática Aplicada Aplicaciones del aprendizaje de máquina
- Published
- 2023
24. Generating class diagrams and use cases from user stories using natural language processing
- Author
-
Tovar Onofre, Miguel Ángel, Camargo Mendoza, Jorge Eliecer, and Unsecurelab Cybersecurity Research Group
- Subjects
Requirements analysis ,Historias de usuario ,Natural language processing ,Ingeniería de la computación-enseñanzas, congresos, conferencias, etc ,Modelos computacionales ,Patterns recognition ,Aprendizaje de maquina ,UML ,Análisis de requerimientos ,Computer engineering - study and teaching - congresses ,User stories ,Procesamiento de lenguaje natural ,Machine learning ,Data structure (computer science) ,Computational models ,Estructura de datos (computadores) ,Reconocimiento de patrones - Abstract
ilustraciones El presente trabajo busca el desarrollo de un modelo computacional para la generación de diagramas UML a partir de historias de usuario en español, por medio de la aplicación de patrones gramaticales y procesamiento de lenguaje natural. Como conjunto de datos se tomaron diferentes conjuntos de historias de usuario traducidas al español y sus correspondientes diagramas generados manualmente. Los patrones aplicados fueron construidos con base en reglas establecidas para este proceso en idioma inglés, las cuales fueron adaptadas al idioma español y con base en los componentes extraídos, se construyen los diagramas. La evaluación del modelo computacional indica que es capaz de detectar los componentes como clases y actores, alcanzando un recall de hasta 0.8 en algunos casos. Sin embargo, presenta problemas de precisión al momento de extraer sus atributos, métodos o casos de uso, llegando a presentar valores inferiores a 0.1 en algunos componentes. Finalmente el modelo establece una base para guiar a los diseñadores y/o analistas en la implementación de proyectos de software. (Texto tomado de la fuente) The present work seeks to develop a computational model for the generation of UML diagrams from Spanish user stories by means of the application of grammatical patterns and natural language processing. Different sets of user stories translated into Spanish and their corresponding manually generated diagrams were taken as a dataset. The applied patterns were constructed based on rules established for this process in English language, which were adapted to Spanish language and based on the extracted components, the diagrams were constructed. The evaluation of the computational model indicates that it is capable of detecting components such as classes and actors, reaching a recall of up to 0.8 in some cases. However, it presents precision problems when extracting attributes, methods or use cases, presenting values lower than 0.1 in some components. Finally, the model establishes a basis to guide designers and/or analysts in the implementation of software projects. Maestría Magíster en Ingeniería - Ingeniería de Sistemas y Computación Para este trabajo, se solicitó a estudiantes de carreras a fines a la ingeniería de software, el análisis de distintos grupos de historias de usuario en español y la posterior generación manual de los diagramas de clase y casos de uso a partir de dicho análisis. De manera paralela, se aplicó procesamiento de lenguaje natural sobre las distintas historias de usuario con el fin de obtener sus características (Tokens, lemmas, etiquetas PoS) y de este modo, obtener mayor información sobre sus estructuras. Posteriormente, se construyeron reglas de patrones para la extracción de componentes UML con base en trabajos previos y las reglas gramaticales del idioma español, las cuales fueron aplicadas sobre las diferentes historias de usuario para la detección de los distintos componentes de los diagramas a construir, de acuerdo a la estructura gramatical de las mismas. Una vez extraídos, los componentes son organizados en un archivo de texto, el cual es procesado por un generador automático de diagramas UML y de este modo, obtener los diagramas correspondientes a los diferentes grupos de historias de usuario. Para la evaluación de desempeño del modelo computacional, se realizó una comparación de los componentes encontrados de manera automática y los componentes obtenidos manualmente, teniendo en cuenta diferentes umbrales de similaridad entre los componentes para calcular la precisión, recall y F1 del modelo computacional, frente a la generación manual de diagramas UML partiendo de historias de usuario. Ingeniería de Software
- Published
- 2023
25. Automatic transmission line fault analysis with response evaluation of inverter-based resources
- Author
-
Flórez Betancourt, Juan Manuel, Pérez González, Ernesto, and Programa de Investigacion sobre Adquisicion y Analisis de Señales Paas-Un
- Subjects
Non-Conventional Renewable Energy Sources ,Fuentes de Energía Renovables No Convencionales ,Línea de transmisión ,Transmission line ,Recursos energéticos renovables ,Sistema Eléctrico de Potencia ,Machine learning ,Distribución de energía eléctrica ,Recursos Basados en Inversores ,Aprendizaje de máquina ,Inverter-Based Resources ,Electric fault ,Sistema de protección ,COMTRADE ,Falla eléctrica ,621 - Física aplicada [620 - Ingeniería y operaciones afines] ,Protection system ,Power system ,Python - Abstract
Ilustraciones Los recursos basados en inversores (RBI) presentan grandes retos para la planeación, programación y operación de los Sistemas Eléctricos de Potencia (SEP). El recurso humano encargado de esta tarea es limitado mientras los sistemas eléctricos crecen exponencialmente. Con el fin de garantizar su operación segura y confiable, un sistema eléctrico debe contar con la capacidad de responder ante diferentes condiciones de cambio en el balance generación-demanda en todas las escalas y horizontes de tiempo; esta capacidad ha sido definida como la flexibilidad del sistema de potencia. Por lo anterior, en este documento se desarrollan los fundamentos para la implementación de un prototipo que automatiza la evaluación de características técnicas de Fuentes de Energía Renovables No Convencionales (FERNC) considerando la generación tradicional que desplaza. Específicamente, se evalúan las curvas FRT (Fault Ride Through) y la inyección prioritaria de corriente reactiva de acuerdo con La regulación colombiana a partir de registro oscilográficos en formato COMTRADE. Complementariamente, se realiza la adaptación del prototipo mencionado con la finalidad de evaluar la operación de los sistemas de protección en líneas de transmisión desde el punto de vista del operador nacional y el despeje oportuno, selectivo y coordinado de las fallas eléctricas (cortocircuito) que se puedan presentar en estos elementos. Esto optimiza el análisis de eventos N-1 en vista del crecimiento de los sistemas eléctricos de potencia considerando que las líneas son los activos más expuestos a fallas de todo el sistema. El desarrollo aprovecha las herramientas propias de la revolución digital, donde los datos estructurados y la extracción de información, apoyados de métodos de aprendizaje de máquina, entregan conclusiones de valor para la toma de decisiones, lo cual se ha vuelto una prioridad para lograr la automatización y optimización de tareas. Finalmente, aquí se exponen los fundamentos matemáticos y técnicos, la regulación vigente asociada a los análisis, los resultados gráficos y las conclusiones del automatismo realizado a través de Python. Todo ello con la premisa de automatizar la operación de los sistemas eléctricos de potencia, siendo esencial para lograr los criterios de calidad en el servicio. (Texto tomado de la fuente) Inverter-based resources present great challenges for the planning, programming and operation of power systems. The human resource who perform this task is limited while electrical systems grow exponentially. An electrical system must have the capacity to respond in different conditions of changes in the generation-demand balance at all scales and time horizons to guarantee safety and reliability in the operation of power system; this capacity has been defined as the flexibility of the power system. Therefore, this document develops the foundations for the implementation of a prototype that automates the evaluation of technical characteristics of non-conventional renewable energy sources considering the traditional generation displaced. Specifically, the Fault Ride Through (FRT) curves and the priority injection of reactive current are evaluated according with the colombian regulation from oscillographic records in COMTRADE format. Complementarily, the prototype is adaptated to evaluate the operation of the protection systems in transmission lines from the point of view of the national operator for the timely, selective and coordinated clearance of electrical faults (short-circuit) in these elements. The automatization optimizes the analysis of N-1 events in the growth of electrical power systems, also it consider that the lines are the element most exposed to failures in the entire system. The development takes advantage of the tools of the digital revolution, the structured data and information extraction, supported by machine learning methods, give valuable conclusions for decision making, this has become a priority to achieve automation and task optimization. Finally, the document exposes the mathematical and technical foundations, the current regulation associated with the analysis, the graphic results and the conclusions of the automation performed in Python. The premise is to automate the operation of electrical power systems, this is essential to achieve the quality criteria in the service. Maestría Maestría en Ingeniería - Ingeniería Eléctrica Sistemas eléctricos de potencia Área Curricular de Ingeniería Eléctrica e Ingeniería de Control
- Published
- 2023
26. (Un)founded fear towards the algorithm: YouTube recommendations and polarisation
- Author
-
García Marín, Javier
- Subjects
Social media ,Recommendation system ,YouTube ,Communication ,Machine learning ,Aprendizaje de máquina ,Redes sociales ,Comunicación ,Sistemas de recomendación ,Polarización ,Polarisation - Abstract
Las redes sociales han instaurado una nueva forma de comunicarse y entender las relaciones sociales. A su vez, en lo que podría entenderse como un aspecto negativo, los algoritmos se han construido y desarrollado bajo el paraguas de un amplio abanico de conjeturas y diferentes posiciones al respecto de su capacidad para dirigir y orquestar la opinión pública. El presente trabajo aborda, desde los procesos de ingeniería inversa y de minado semántico, el análisis del sistema de recomendación de YouTube. De este modo, y, en primer lugar, reseñar un resultado clave, las temáticas analizadas de partida no tienden a extremarse. Seguidamente, y mediante el estudio de los temas seleccionados, los resultados no ofrecen una clara resolución de las hipótesis propuestas, ya que, como se ha mostrado en trabajos parecidos, los factores que dan forma al sistema de recomendación son variados y de muy diversa índole. De hecho, los resultados muestran cómo el contenido polarizante no es igual para todos los temas analizados, lo que puede indicar la existencia de moderadores –o acciones por parte de la compañía– que alteran la relación entre las variables. Con todo ello, trabajos como el presente abren la puerta a posteriores incursiones académicas en las que trazar sistematizaciones no lineales y con las que, tal vez, poder arrojar un sustento más neto y sustancial que permita despejar por completo parte de las dudas sobre el papel de los algoritmos y su papel en fenómenos sociales recientes., Social media have established a new way of communicating and understanding social relationships. At the same time, there are downsides, especially, their use of algorithms that have been built and developed under their umbrella and their potential to alter public opinion. This paper tries to analyse the YouTube recommendation system from the perspectives of reverse engineering and semantic mining. The first result is that, contrary to expectations, the issues do not tend to be extreme from the point of view of polarisation in all cases. Next, and through the study of the selected themes, the results do not offer a clear answer to the proposed hypotheses, since, as has been shown in similar works, the factors that shape the recommendation system are very diverse. In fact, results show that polarising content does not behave in the same way for all the topics analysed, which may indicate the existence of moderators –or corporate actions– that alter the relationship between the variables. Another contribution is the confirmation that we are dealing with non-linear, but potentially systematic, processes. Nevertheless, the present work opens the door to further academic research on the topic to clarify the unknowns about the role of these algorithms in our societies., I+D+i PID2021-128272NB-I00 financiado por MCIN/ AEI/10.13039/501100011033/ FEDER “Una manera de hacer Europa”
- Published
- 2023
27. Miedo (in)fundado al algoritmo: Las recomendaciones de YouTube y la polarización
- Author
-
García Marín, Javier and Serrano Contreras, Ignacio Jesús
- Subjects
Social media ,Recommendation system ,YouTube ,Communication ,Machine learning ,Aprendizaje de máquina ,Redes sociales ,Comunicación ,Sistemas de recomendación ,Polarización ,Polarisation ,6308 Comunicaciones Sociales - Abstract
Las redes sociales han instaurado una nueva forma de comunicarse y entender las relaciones sociales. A su vez, en lo que podría entenderse como un aspecto negativo, los algoritmos se han construido y desarrollado bajo el paraguas de un amplio abanico de conjeturas y diferentes posiciones al respecto de su capacidad para dirigir y orquestar la opinión pública. El presente trabajo aborda, desde los procesos de ingeniería inversa y de minado semántico, el análisis del sistema de recomendación de YouTube. De este modo, y, en primer lugar, reseñar un resultado clave, las temáticas analizadas de partida no tienden a extremarse. Seguidamente, y mediante el estudio de los temas seleccionados, los resultados no ofrecen una clara resolución de las hipótesis propuestas, ya que, como se ha mostrado en trabajos parecidos, los factores que dan forma al sistema de recomendación son variados y de muy diversa índole. De hecho, los resultados muestran cómo el contenido polarizante no es igual para todos los temas analizados, lo que puede indicar la existencia de moderadores –o acciones por parte de la compañía– que alteran la relación entre las variables. Con todo ello, trabajos como el presente abren la puerta a posteriores incursiones académicas en las que trazar sistematizaciones no lineales y con las que, tal vez, poder arrojar un sustento más neto y sustancial que permita despejar por completo parte de las dudas sobre el papel de los algoritmos y su papel en fenómenos sociales recientes., Social media have established a new way of communicating and understanding social relationships. At the same time, there are downsides, especially, their use of algorithms that have been built and developed under their umbrella and their potential to alter public opinion. This paper tries to analyse the YouTube recommendation system from the perspectives of reverse engineering and semantic mining. The first result is that, contrary to expectations, the issues do not tend to be extreme from the point of view of polarisation in all cases. Next, and through the study of the selected themes, the results do not offer a clear answer to the proposed hypotheses, since, as has been shown in similar works, the factors that shape the recommendation system are very diverse. In fact, results show that polarising content does not behave in the same way for all the topics analysed, which may indicate the existence of moderators –or corporate actions– that alter the relationship between the variables. Another contribution is the confirmation that we are dealing with non-linear, but potentially systematic, processes. Nevertheless, the present work opens the door to further academic research on the topic to clarify the unknowns about the role of these algorithms in our societies.
- Published
- 2023
28. Implementation of an intrusion detection system supported by supervised service-oriented learning techniques in the cloud for the detection of distributed denial of service attacks
- Author
-
Montes Gil, José Albeiro, Duque Méndez, Néstor Darío, Isaza Echeverri, Gustavo Adolfo, and Gaia Grupo de Ambientes Inteligentes Adaptativos
- Subjects
Machine learning ,SOA ,Aprendizaje de máquina ,IDS ,Attacks ,DoS ,DDoS ,000 - Ciencias de la computación, información y obras generales - Abstract
graficas, tablas Dados los avances presentados en la actualidad en el área de las Tecnologías de la Información y las Comunicaciones, la dependencia de las organizaciones hacia los activos tecnológicos cada día es más importante, razón por la cual, el área de seguridad informática tiene la responsabilidad de proporcionar mecanismos que garanticen la protección de la infraestructura tecnológica. Sin embargo, actualmente son constantes los ataques informáticos, los cuales buscan afectar la disponibilidad, integridad o confidencialidad de los datos y la información. A pesar de los numerosos mecanismos de seguridad con los que se cuenta actualmente, los atacantes logran vulnerar los diferentes mecanismos de protección, en particular, realizando ataques de Denegación de Servicios (DoS) y Denegación de Servicios Distribuidos (DDoS). Teniendo en cuenta que a pesar de la implementación de sistemas de seguridad tradicionales, no se ha conseguido una mitigación de los ataques en su totalidad, la adaptación de técnicas de aprendizaje supervisado para la detección de ataques de tipo DoS/DDoS es viable, dada la capacidad de los algoritmos de inteligencia artificial para clasificar y emitir predicciones. La comunidad científica respalda ampliamente la propuesta de implementar Sistemas de Detección de Intrusos usando técnicas de inteligencia artificial, no obstante, las soluciones desarrolladas no están orientadas a usuarios administradores de seguridad en redes sin conocimientos en aprendizaje de máquina y con la generación de reportes dinámicos y con carácter estadístico orientado a servicios en la nube. En esta tesis de maestría, se propuso el diseño e implementación de una arquitectura orientada a servicios en la nube, la selección de las técnicas de aprendizaje supervisado más relevantes en la detección de ataques DoS/DDoS y la implementación del sistema de Detección de Intrusos. El prototipo demuestra que las técnicas de aprendizaje supervisado pueden ser implementadas como servicios en la nube, garantizando su desempeño en la detección de este tipo de ataques en redes físicas y en tiempo real. (Texto tomado de la fuente) Given the advances presented today in the field of Information and Communication Technologies, the dependence of organizations on technological assets is becoming increasingly important. Therefore, the area of computer security has the responsibility to provide mechanisms that ensure the protection of technological infrastructure. However, cyberattacks seeking to affect the availability, integrity, or confidentiality of data and information are becoming increasingly constant. Despite the numerous security mechanisms currently available, attackers manage to compromise different protection mechanisms, particularly by carrying out Denial of Service (DoS) and Distributed Denial of Service (DDoS) attacks. Considering that traditional security systems have not achieved complete mitigation of attacks, the adaptation of supervised learning techniques for DoS/DDoS attack detection is viable given the ability of artificial intelligence algorithms to classify and make predictions. The scientific community widely supports the proposal to implement Intrusion Detection Systems using artificial intelligence techniques. However, the solutions developed are not aimed at security administrators in networks without knowledge of machine learning and with the generation of dynamic and statistical reports oriented towards cloud services. This master's thesis proposes the design and implementation of a cloud-oriented architecture, the selection of the most relevant supervised learning techniques in the detection of DoS/DDoS attacks, and the implementation of the Intrusion Detection System. The prototype demonstrates that supervised learning techniques can be implemented as cloud services, guaranteeing their performance in detecting these types of attacks in physical networks in real-time. Maestría Magíster en Administración de Sistemas Informáticos Inteligencia Artificial Informática Y Computación.Sede Manizales
- Published
- 2023
29. Machine learning algorithms for prediction of physicochemical soil properties by spectral information: a systematic review
- Author
-
Mateo Vargas-Zapata, Marisol Medina-Sierra, Luis Fernando Galeano-Vasco, and Mario Fernando Cerón-Muñoz
- Subjects
aprendizaje de máquina ,spectroscopy ,machine learning ,chemical analysis ,algoritmos de predicción ,espectroscopía ,General Medicine ,prediction algorithms ,análisis químico - Abstract
Resumen En la literatura científica actual se discute ampliamente acerca de la predicción de propiedades edáficas mediante información espectral. El objetivo de esta revisión fue encontrar algoritmos con el mayor potencial predictivo para las propiedades fisicoquímicas del suelo, basados en información espectral capturada con diferentes instrumentos. Se realizó una revisión sistemática en la cual se encontraron 121 artículos de los cuales se eligieron 19, que cumplieran con un coeficiente de determinación mayor a 0,80 o una raíz del error cuadrado medio cercana a 0. Se determinó que el rango espectral más utilizado corresponde al rango desde 350 hasta 2500 nm; los algoritmos mínimos cuadrados parciales, máquina de soporte vectorial y máquina de soporte vectorial ajustado son adecuadas para predecir pH, materia orgánica y carbono orgánico. Además, la regresión lineal solo es efectiva para predecir el carbonato de calcio, materia orgánica, humedad y contenido de agua mediante bandas individuales. Abstract The prediction of soil properties through spectral information is widely discussed in the current scientific literature. The objective of this review was to find algorithms with the highest predictive potential for soil physicochemical properties based on spectral information captured with different instruments. A systematic review was carried out in which 121 articles were found, and 19 of them were chosen which met a determination coefficient greater than 0.80 or a root mean square error close to 0. It was determined that the most used spectral range corresponds to the range from 350 to 2500 nm; the partial least squares, support vector machine, and adjusted support vector machine algorithms are suitable for predicting pH, organic matter, and organic carbon. Furthermore, linear regression is only effective in predicting calcium carbonate, organic matter, moisture, and water content using individual bands.
- Published
- 2022
30. Predicción inmediata de la actividad económica con datos de pagos electrónicos. Un enfoque de modelado predictivo
- Author
-
Carlos León and Fabio Ortega
- Subjects
pronóstico ,aprendizaje de máquina ,red neuronal ,pagos minoristas ,Red narx. ,Economics as a science ,HB71-74 - Abstract
La predicción inmediata de la actividad económica (es decir, hacer estimaciones del período actual), es conveniente porque la mayoría de las medidas tradicionales de actividad económica se realizan con rezagos sustanciales. Nuestro objetivo es predecir el ISE, un indicador de actividad económica de corto plazo en Colombia. Las entradas son los rezagos del ISE y un conjunto de datos de pagos realizados entre individuos, empresas y el gobierno central, mediante transferencias electrónicas y cheques. Bajo un enfoque de modelado predictivo, empleamos un modelo de red neuronal exógena autoregresiva no lineal. Los resultados sugieren que nuestra elección de insumos y el método predictivo, nos permiten difundir la actividad económica con una precisión razonable. Además, validamos que los datos de pagos electrónicos reducen significativamente el error de predicción en un modelo de red neuronal autoregresiva de referencia. La predicción inmediata de la actividad económica con datos de los instrumentos de pago electrónicos, no solo contribuye a la toma de decisiones de los agentes y al modelado económico, sino que también soporta nuevas vías de investigación sobre cómo utilizar dichos datos en modelos actuales.
- Published
- 2018
- Full Text
- View/download PDF
31. OPTIMAL REPRESENTATION OF MER SIGNALS APPLIED TO THE IDENTIFICATION OF BRAIN STRUCTURES DURING DEEP BRAIN STIMULATION
- Author
-
Hernán Darío Vargas Cardona, Mauricio A. Álvarez López, and Álvaro A. Orozco Gutiérrez
- Subjects
Aprendizaje de máquina ,Enfermedad de Parkinson ,Estimulación cerebral profunda ,Procesamiento digital de señales ,Señales MER ,Technology ,Engineering (General). Civil engineering (General) ,TA1-2040 - Abstract
Identification of brain signals from microelectrode recordings (MER) is a key procedure during deep brain stimulation (DBS) applied in Parkinson’s disease patients. The main purpose of this research work is to identify with high accuracy a brain structure called subthalamic nucleus (STN), since it is the target structure where the DBS achieves the best therapeutic results. To do this, we present an approach for optimal representation of MER signals through method of frames. We obtain coefficients that minimize the Euclidean norm of order two. From optimal coefficients, we extract some features from signals combining the wavelet packet and cosine dictionaries. For a comparison frame with the state of the art, we also process the signals using the discrete wavelet transform (DWT) with several mother functions. We validate the proposed methodology in a real data base. We employ simple supervised machine learning algorithms, as the K-Nearest Neighbors classifier (K-NN), a linear Bayesian classifier (LDC) and a quadratic Bayesian classifier (QDC). Classification results obtained with the proposed method improves significantly the performance of the DWT. We achieve a positive identification of the STN superior to 97,6%. Identification outcomes achieved by the MOF are highly accurate, as we can potentially get a false positive rate of less than 2% during the DBS.
- Published
- 2015
- Full Text
- View/download PDF
32. La nueva inteligencia artificial: conceptos básicos y aplicaciones
- Author
-
Pons, Claudia Fabiana, Pérez, Gabriela Alejandra, and Baum, Gabriel
- Subjects
Redes neuronales artificiales ,Ciencias de la Computación e Información ,Aprendizaje de máquina ,Inteligencia Artificial - Abstract
En este artículo se explican los conceptos teóricos y las nociones intuitivas que conforman a la nueva Inteligencia Artificial, en especial al Aprendizaje de Máquina basado en Redes Neuronales Artificiales. Se recorren sus orígenes y fundamentos. Se describen sus principales aplicaciones y herramientas técnicas. Finalmente se comparten reflexiones acerca de las tendencias tecnológicas en el área y se presentan experiencias de aplicaciones desarrolladas en grupos de investigación de la Universidad Nacional de La Plata.
- Published
- 2022
33. Fault detection in unmanned aerial vehicles via orientation signals and machine learning
- Author
-
Francisco-Ronay López-Estrada, Guillermo Valencia-Palomo, Elías N. Escobar-Gómez, Ildeberto Santos-Ruiz, and A. Méndez-López
- Subjects
0209 industrial biotechnology ,aprendizaje de máquina ,análisis en componentes principales ,General Computer Science ,Computer science ,Vehículo aéreo no tripulado ,Feature extraction ,02 engineering and technology ,cuadrirrotor ,Principal component analisys ,detección e identificación de fallas ,020901 industrial engineering & automation ,Quadrotor ,Machine learning ,0202 electrical engineering, electronic engineering, information engineering ,Detección e identificación de fallas ,Aprendizaje de máquina ,Computer vision ,vehículo aéreo no tripulado ,Cuadrirrotor ,Control engineering systems. Automatic machinery (General) ,Angular displacement ,Orientation (computer vision) ,business.industry ,020208 electrical & electronic engineering ,Unmanned aerial vehicle ,Support vector machine ,Statistical classification ,Control and Systems Engineering ,TJ212-225 ,Principal component analysis ,Fault detection and isolation ,Análisis en componentes principales ,Artificial intelligence ,Actuator ,business ,Subspace topology - Abstract
[EN] This work proposes an actuator fault detection and isolation scheme for a quadrotor unmanned aerial vehicle (UAV) under a data-driven approach using machine learning techniques. In this approach, an implicit model of the system is built through the information provided by the onboard sensors of the UAV. First, using a tailored flying platform, vibrations corresponding to the orientation, angular position and linear acceleration were captured with the UAV flying in hover mode under nominal conditions. This data is processed by Principal Component Analysis (PCA) for feature extraction. Subsequently, faults in the actuators are induced through a cut in each of the UAV propellers which generate a reduction in the thrust of the rotors. These data are also projected into the PCA subspace and compared to the nominal data. Hotelling’s T 2 statistic is used to discern between nominal data and data when the vehicle exhibits an actuator fault. Finally, the developed algorithms were complemented with k-nearest neighbors (k-NN) and support vector machine (SVM) classification algorithms. The results show a correct classification rate of 89.6 % (k-NN) and 92.4 % (SVM) respectively for 423 validation datasets., [ES] Este trabajo propone un esquema de detección y localización de fallas en los actuadores de un vehículo aéreo no tripulado (VANT) del tipo cuadrirrotor. Para ello, se considera un enfoque basado en datos haciendo uso de técnicas de aprendizaje de máquina. En este enfoque se construye un modelo implícito del sistema a través de la información proporcionada por los sensores del VANT. Primero, a través de un plataforma de vuelo de tipo giroscópica, se captan las vibraciones correspondientes a la orientación, posición angular y aceleración lineal cuando el vehículo se encuentra en vuelo estacionario en condiciones nominales. Estos datos se procesan mediante Análisis en Componentes Principales (PCA) para la extracción de características. Posteriormente, se induce una falla a los actuadores a través de un recorte en cada una de las hélices del VANT que ocasionan una reducción del empuje generado por los rotores. Estos datos se proyectan también al subespacio de componentes principales y se comparan con los datos nominales. Para discernir entre los datos nominales y los datos cuando el vehículo presenta falla, se emplea el estadístico T2 de Hotelling. Finalmente, el desarrollo se complementa con los algoritmos de clasificación de k-vecinos más cercanos (k-NN) y de máquina de vectores de soporte (SVM). Los resultados muestran una tasa de clasificación correcta del 89.6 % (k-NN) y 92.4 %(SVM) respectivamente para 423 conjuntos de datos de validación.
- Published
- 2021
34. Characterization of swallowing sounds through Cervical Auscultation in healthy and dysphagic subjects
- Author
-
Juan Pablo Betancur Rengifo, Juan Pablo Restrepo Uribe, Estefania Pérez Giraldo, and Andrés Orozco Duque
- Subjects
procesamiento de señales ,aprendizaje de máquina ,disfagia ,accuracy ,dysphagia ,feature extraction ,clasificación ,extracción de características ,Cervical auscultation ,exactitud ,machine learning ,classification ,General Earth and Planetary Sciences ,score ,invasivos ,Auscultación cervical ,signal processing ,invasive ,rendimiento ,difficulties ,dificultades ,General Environmental Science - Abstract
La deglución es un acto de alta complejidad neuromuscular debido a que intervienen más de 30 pares musculares y 5 pares craneales en un periodo corto de tiempo. Esta se divide en 4 etapas: pre oral, oral, orofaríngea y esofágica, una alteración en el desarrollo normal de alguna de estas fases puede desarrollar un síntoma secundario a enfermedades neuromusculares y neurogénicas que se conoce como disfagia, esta puede traer consigo muchas dificultades para quien la padece, entre esta neumonía bronquial, desnutrición, deshidratación o incluso la muerte por asfixia. La identificación de características que ayuden a reconocer dicho síntoma, además de describir correctamente el proceso deglutorio, es de gran importancia ya que los métodos existentes son invasivos. La auscultación cervical es una técnica mediante la cual se puede obtener información del cierre glótico en el proceso deglutorio por medio de señales de audio, y que puede ser analizada de manera off line. El objetivo de este estudio es evaluar diferentes métodos de caracterización de señales de auscultación cervical y desarrollar un modelo de aprendizaje automático con sonidos de eventos deglutorios segmentados de forma manual para clasificar entre sujetos de control y pacientes con disfagia orofaríngea. Los resultados mostraron, con una exactitud máxima de 75 %, que por medio de señales de auscultación cervical es posible identificar sujetos con disfagia, de igual manera se logró identificar que la potencia media de los segmentos deglutorios fue la característica con mejor rendimiento (curva ROC) y una distribución diferente entre clases según la prueba de U-Mann-Whitney, para discriminar entre sanos y pacientes en diferentes actividades deglutorias. Swallowing is an act of high neuromuscular complexity due to the involvement of more than 30 muscle pairs and 5 cranial pairs that occurs in a short period of time. This activity is divided into 4 stages: pre-oral, oral, oropharyngeal and esophageal, an alteration in the normal development of this process can develop a symptom secondary to neuromuscular and neurogenic diseases that is known as dysphagia. Dysphagia can bring many difficulties for those who suffer from it including bronchial pneumonia, malnutrition, dehydration or even death by asphyxia. The identification of characteristics that help recognize this symptom, in addition to correctly describing the swallowing process is of great importance since the existing methods are invasive. Cervical auscultation is a technique by which information about the gothic closure can be obtained in the swallowing process using audio signals, and which can be analyzed offline. The aim of this study is to evaluate different methods of characterization of cervical auscultation signals and develop a machine learning model with manually segmented swallowing event sounds to classify between control subjects and patients with oropharyngeal dysphagia. The results showed, with a maximum accuracy of 75% that by means of signs is cervical auscultation it is possible to identify dysphageal subjects. In the same way it was possible to identify that the average potency of the swallowing segments was the feature with the best score (ROC curve) and that exists a different distribution between classes in this characteristic according to the U-Mann-whitney test to discriminate between healthy and pathologic subjects during different swallowing activities.
- Published
- 2022
35. Method for the classification of driving behaviors based on machine learning techniques, using physiological signals and sensors captured by wearable devices. Case of Study: Metropolitan Area Drivers of Aburrá Valley
- Author
-
Lombana Martinez, Juan Manuel and Espinosa Bedoya, Albeiro
- Subjects
aprendizaje de máquina ,Muertes en accidentes de transito ,svm ,Driving behavior ,004 - Procesamiento de datos Ciencia de los computadores [000 - Ciencias de la computación, información y obras generales] ,naive-bayes ,Road traffic deaths ,Enseñanza para conducción de automóviles ,machine learning ,Aprendizaje automático (Inteligencia artificial) ,Estilo de Conducción ,maquinas de vectores de soporte ,Automobile driver education ,árbol de decisión ,decision tree ,conjunto de datos ,dataset - Abstract
diagramas, tablas La clasificación de los estilos de conducción usando aprendizaje de máquina es una propuesta novedosa al problema de salud pública y los impactos macroeconómicos que representa la pérdida de vidas debido a la accidentalidad vial. En este trabajo se propone el uso de relojes inteligentes para monitorear diversos aspectos del conductor y para las tareas de clasificación se han implementado algoritmos de máquinas de vectores de soporte (SVM), árboles de decisión y clasificador ingenuo de bayes. Como conclusión principal se muestra la correlación que tienen los patrones de sueño con el estilo de conducción, así como la pertinencia del uso de estos dispositivos para la construcción de un conjunto de datos de buena calidad. (Texto tomado de la fuente) Machine learning driving behavior classification is a novel proposal to face public health problems and macroeconomy impacts that suppose road traffic injury deaths. This project proposes the use of smart watches to monitor different aspects of drivers, for classification tasks we had implemented support vector machines (SVM), decision trees and naïve bayes classificator. We show strong correlation between sleep patterns and driving behavior as main conclusion, also the relevance of using wearable devices to build high quality datasets. Maestría Magíster en Ingeniería - Ingeniería de Sistemas Área Curricular de Ingeniería de Sistemas e Informática
- Published
- 2022
36. Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información
- Author
-
Luis Alexánder Calvo-Valverde
- Subjects
Aprendizaje de máquina ,minería de datos ,conjuntos aproximados ,entropía ,ganancia de información ,reducción de atributos ,Technology - Abstract
Hoy en día se recogen datos de muy diversa índole y a un bajo costo, como no se había visto antes en la historia de la humanidad; por ejemplo, sensores que registran datos a cada minuto, páginas web que almacenan todas las acciones que realiza el usuario, supermercados que guardan todo lo que sus clientes compran y en qué momento lo hacen. Pero estas grandes bases de datos presentan un gran reto a sus propietarios ¿Cómo sacarles provecho?, ¿cómo convertir datos en información para la toma de decisiones? Este artículo presenta una estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados utilizando conjuntos aproximados y/o ganancia de información. Se propone una estrategia para agrupar los datos utilizando k-means, considerando cuánta información aporta un atributo (ganancia de información), además de poder seleccionar cuáles atributos son realmente indispensables para clasificar nuevos datos y cuáles son dispensables (conjuntos aproximados), lo cual es muy beneficioso pues permite tomar decisiones en menor tiempo.
- Published
- 2016
- Full Text
- View/download PDF
37. Transformación Digital de la Banca: Modelo basado en Machine Learning para la clasificación de transacciones bancarias realizadas a través de PSE
- Author
-
Urrego Álvarez, Mauricio, Yepes Sánchez, Edison, Soto Duran, Darío Enrique, and Vargas Agudelo, Fabio Alberto
- Subjects
Procesamiento de lenguaje natural ,Aprendizaje de máquina ,Clasificación de texto ,Transacciones bancarias ,Aprendizaje automático - Abstract
ilustraciones, anexos Esta investigación de maestría consiste en el desarrollo de una propuesta de modelo de clasificación usando técnicas de Machine Learning (ML), mediante el aprendizaje supervisado, que permita asignar una categoría a una transacción realizada en la plataforma de pagos seguros PSE, a partir de su descripción en texto libre. Se realizó una detallada búsqueda de proyectos que permitieron identificar los principales retos, técnicas y metodologías usadas para resolver problemas similares, y sirvieron como apoyo al contexto del proyecto. El modelo propuesto para clasificación de transacciones a través de pasarelas de pago, tiene como propósito apoyar en el análisis de las finanzas personales del sector de la banca. Para el desarrollo de la propuesta, se siguieron las fases de la metodología CRISP-DM, obteniendo como resultado un modelo óptimo de ML, que dio solución al problema de clasificación planteado. Contenido Pág. 1. Introducción ........................................................................................................... 17 Motivación ......................................................................................................... 17 Planteamiento del Problema ............................................................................. 18 Pregunta de Investigación ................................................................................. 20 Hipótesis ........................................................................................................... 20 Objetivos ........................................................................................................... 21 1.5.1 Objetivo General ............................................................................................ 21 1.5.2 Objetivos Específicos: ................................................................................... 21 Marco Teórico ................................................................................................... 21 1.6.1 Conceptos Generales: ................................................................................... 21 Machine Learning ..................................................................................................... 21 Big Data ................................................................................................................... 23 Lematización ............................................................................................................ 24 Optimización. ........................................................................................................... 25 Evaluación de modelos. ........................................................................................... 27 1.6.2 Metodologías para Proyectos de Machine Learning. ..................................... 29 KDD (Knowledge Discovery in Databases) .............................................................. 30 CATALYST .............................................................................................................. 31 CRISP-DM (Cross Industry Standard Process for Data Mining) ............................... 33 SEMMA (Sample, Explore, Modify, Model, and Assess) .......................................... 34 ASUM-DM (Analytics Solutions Unified Method for Data Mining) ............................. 35 1.6.3 Algoritmos de Clasificación ............................................................................ 36 KNN (K Vecinos más Cercanos) .............................................................................. 36 SVM (Maquinas de Soporte Vectorial) ..................................................................... 38 Regresión Logística ................................................................................................. 39 Arboles de Decisión ................................................................................................. 40 1.6.4 Pasarela de Pagos: ....................................................................................... 41 Metodología ...................................................................................................... 42 1.7.1 Fase de exploración. ..................................................................................... 42 1.7.2 Fase de Integración. ...................................................................................... 44 1.7.3 Fase de validación. ........................................................................................ 45 2. ESTADO DEL ARTE DE LA APLICACIÓN DE MACHINE LEARNING EN EL DOMINIO DE LA BANCA Y OTROS SECTORES, EN PROBLEMAS DE CLASIFICACIÓN. ........................................................................................................... 46 Revisión de Literatura ....................................................................................... 46 2.1.1 Resumen Comparativo .................................................................................. 53 3. COMPARATIVA ENTRE METODOLOGÍAS PARA EL DESARROLLO DE PROYECTOS DE MACHINE LEARNING....................................................................... 57 Comparativa y Resultados. ............................................................................... 58 4. DEFINICIÓN Y VALIDACIÓN DE LA PROPUESTA. .............................................. 62 Adaptación Metodológica. ................................................................................. 62 Definición del Modelo. ...................................................................................... 63 4.2.1 ANALYSIS .................................................................................................... 65 4.2.2 DATA ENGINEERING ................................................................................... 70 4.2.3 MODELING ................................................................................................... 73 5. Impacto Esperado .................................................................................................. 79 6. Conclusiones y Trabajos Futuros ........................................................................ 80 Conclusiones .................................................................................................... 80 Trabajos Futuros............................................................................................... 82 Lista de figuras Figura 1 Diagrama Ishikawa ............................................................................................ 19 Figura 2 Machine Learning .............................................................................................. 22 Figura 3 Fórmula TF-IDF ................................................................................................. 26 Figura 4 Fórmula IDF ...................................................................................................... 27 Figura 5 Proceso de medición ......................................................................................... 28 Figura 6 Etapas en un proyecto de Machine Learning. .................................................... 29 Figura 7 Metodología KDD. ............................................................................................. 31 Figura 8 Metodología CATALYST (MII). .......................................................................... 32 Figura 9 Metodología CATALYST (MIII). ......................................................................... 33 Figura 10 Metodología CRISP-DM. ................................................................................. 34 Figura 11 Metodología SEMMA....................................................................................... 35 Figura 12 Metodología ASUM-DM. .................................................................................. 36 Figura 13 Algoritmo KNN................................................................................................. 37 Figura 14 Diagrama de Voronoi....................................................................................... 38 Figura 15 Algoritmo SVM ................................................................................................ 39 Figura 16 Función Sigmoide ............................................................................................ 39 Figura 17 Algoritmo Árboles de decisión ......................................................................... 40 Figura 18 Proceso de Pasarela de Pagos. ...................................................................... 41 Figura 19 Pagos Seguros en Línea. PSE. ....................................................................... 42 Figura 20 Encuesta realizada por KDnuggets (2014). ..................................................... 58 Figura 21 Adaptación metodológica ................................................................................ 62 Figura 22 Flujo de trabajo del modelo propuesto ............................................................. 64 Figura 23 Relación financiera .......................................................................................... 66 Figura 24 Proceso de transferencia en PSE .................................................................... 67 Figura 25 Resultado de TF-IDF ....................................................................................... 72 Figura 26 Resultado de entrenamiento con KNN ............................................................ 74 Figura 27 Resultado de entrenamiento con Arboles de Decisión..................................... 75 Figura 28 Resultado de entrenamiento con SVM ............................................................ 75 Figura 29 Resultado de entrenamiento con SVM ............................................................ 76 Figura 30 Resultado de entrenamiento con Regresión Logística ..................................... 76 Figura 31 Ejemplo usando set de pruebas ...................................................................... 77 Figura 32 Ejemplo de estimación .................................................................................... 77 Figura 33 Resultado de la evaluación de modelo ............................................................ 78 Lista de tablas Tabla 1 Proceso de lematización .................................................................................... 25 Tabla 2 Ejemplo TF-IDF .................................................................................................. 26 Tabla 3 Ejemplo TF-IDF .................................................................................................. 26 Tabla 4 Ejemplo TF-IDF .................................................................................................. 27 Tabla 5 Resumen comparativo de artículos .................................................................... 51 Tabla 6 Resumen comparativo de artículos .................................................................... 54 Tabla 7 Resumen comparativo de metodologías ............................................................ 59 Tabla 8 Resumen comparativo de metodologías ............................................................ 59 Tabla 9 Actividades, resultado y objetivo. ....................................................................... 65 Tabla 10 Ejemplo de set de datos de transacciones ....................................................... 68 Tabla 11 Ejemplo de set de datos de transacciones transformado ................................. 71 Tabla 12 Ejemplo de set de datos de etiquetas ............................................................... 72 Tabla 13 Estadísticas del set de datos de evaluación ..................................................... 77 Maestría Magister en gestión de tecnologías de la información
- Published
- 2022
38. Diseño de un controlador aplicado a un péndulo invertido utilizando estrategias basadas en aprendizaje de máquina
- Author
-
Rincón Martínez, Julián, Pineda Gonzalez, Gustavo Alonso, Guarnizo Marín, José Guillermo, Camacho Poveda, Edgar Camilo, and Universidad Santo Tomás
- Subjects
No lineal System ,Simulink ,Simple Inverted Pendulum ,Maquinas-- Ingeniería Electrónica-- Colombia ,Controller ,Levenberg-Marquardt ,Péndulo Invertido Simple ,Machine Learning ,Controlador ,Red Neuronal ,NARX ,Aprendizaje de máquina ,Neuronal Network ,Aprendizaje-- Clasificación-- Colombia ,Red Neuronal-- Ingeniería Electrónica ,Sistema no lineal - Abstract
Este documento presenta el desarrollo de controlador aplicado a un péndulo invertido simple, utilizando estrategias basadas en aprendizaje de máquina. Para el desarrollo de este proyecto, se hace uso de una plataforma simulada en el software Simulink, la cual realiza una respectiva caracterización del sistema y una representación de la planta a partir de diagrama de bloques implementado en este Software. En este documento se muestran las ecuaciones no lineales de la planta para que, a partir del comportamiento de esta, se diseñe un control basado en redes neuronales que sea capaz de estabilizar la posición angular del péndulo invertido alrededor de un punto de trabajo específico. El desarrollo del proyecto se divide en 4 fases importantes. La primera fase consiste en conocer las variables de entrada y salida de la planta que se usarán para el diseño de la red neuronal. La variable de entrada hace referencia al voltaje inyectado a la planta, mientras que las variables de salida hacen referencia a los ángulos del péndulo y del brazo giratorio. También se muestran las ecuaciones que describen el comportamiento del sistema de péndulo invertido. En la segunda fase se hace una revisión en el estado del arte, esto con el fin de observar metodologías implementadas en trabajos anteriores, tomando como partida algunos métodos de aprendizaje de máquina que puedan ser usados para el control de posición angular en un péndulo. La tercera fase consiste en la obtención de los datos de la planta que serán los usados en el diseño de las redes neuronales como conjunto de datos de entrenamiento y pruebas. A partir de los datos obtenidos en la tercera fase, en la cuarta fase se implementa la red neuronal con su respectivo entrenamiento y será la encargada de estabilizar el péndulo. Se presentan los resultados experimentales que se llevaron a cabo sobre las redes neuronales implementadas, teniendo en cuenta diferentes pruebas realizadas, haciendo cambios en parámetros como los retardos, los ciclos, la frecuencia de muestreo o los datos de entrada. También se hace un análisis de estas pruebas y de las gráficas obtenidas del sistema a partir de parámetro de error, con el fin observar el comportamiento del péndulo una vez la red neuronal ha sido entrenada. This document presents the development of a controller applied to a simple inverted pendulum, using strategies based on machine learning. For the development of this project, a simulated platform is used in the Simulink software, which performs a respective characterization of the system and a representation of the plant from a block diagram implemented in this Software. In this document, the non-linear equations of the plant are shown so that, based on its behavior, a control based on neural networks is designed that is capable of stabilizing the angular position of the inverted pendulum around a specific work point. The development of the project is divided into 4 important phases. The first phase consists of knowing the input and output variables of the plant that will be used for the design of the neural network. The input variable refers to the voltage injected into the plant, while the output variables refer to the angles of the pendulum and the rotating arm. The equations that describe the behavior of the inverted pendulum system are also shown. In the second phase, a review of the state of the art is made, this in order to observe methodologies implemented in previous works, taking as a starting point some machine learning methods that can be used for angular position control in a pendulum. The third phase consists of obtaining the plant data that will be used in the design of the neural networks as a set of training and testing data. From the data obtained in the third phase, in the fourth phase the neural network is implemented with its respective training and it will be in charge of stabilizing the pendulum. The experimental results that were carried out on the implemented neural networks are presented, taking into account different tests carried out, making changes in parameters such as delays, cycles, sampling frequency or input data. An analysis of these tests and of the graphs obtained from the system from the error parameter is also made, in order to observe the behavior of the pendulum once the neural network has been trained. Ingeniero Electronico Pregrado
- Published
- 2022
39. Simulación de artificios en imágenes de tomografía computarizada y clasificación automática usando algoritmos de machine learning
- Author
-
Bustos Garay, Carlos Andrés and Almeida Moreno, Javier Andrés
- Subjects
Tomografía axial computarizada ,Simulación de artificios ,Aprendizaje de máquina ,Clasificación automática - Abstract
La Tomografía axial computada ha permitido el diagnóstico temprano de múltiples patologías en cualquier parte del cuerpo. La exploración del cráneo y del cerebro por medio de un escáner nos muestra de manera detallada cada estructura que lo componen y acompañado de medios de contraste resalta las estructuras vasculares circundantes. En la práctica de un estudio pueden aparecer artificios o artefactos independientemente de su origen, que limitan la exploración escanográfica, esto lleva a detener el examen e iniciar de nuevo y sumado a esto con los medios de contraste se tienen que aplicar de nuevo dichos fármacos. Los escáneres de ´ultima generación permiten realizar reconstrucciones completas con pocas proyecciones limitando las dosis de radiación, por medio de métodos algebraicos estadísticos de reconstrucción. El presente trabajo muestra la simulación de artificios en imágenes de tomografía computarizada cerebral, la extracción de características de cada imagen y un algoritmo de clasificación automática para la diferenciación de los artefactos simulados. Los resultados muestran que el algoritmo es capaz de clasificar los artificios simulados con un porcentaje de 90 % debajo de la curva ROC. Indice 1. Planteamiento del problema 1.1. Pregunta problema 2. Objetivos 2.1. Objetivo general 2.2. Objetivos específicos 3. Estado del arte 4. Marco teórico 4.1. Arquitecturas de sistemas computacionales 4.2. Reconstrucción de imágenes 4.3. Obtención de sinograma 4.4. Principios matemáticos de reconstrucción de imágenes 4.5. Métodos Analíticos 4.6. Transformada de Radón 4.7. El teorema de corte Fourier 4.8. Algoritmo de retroproyección filtrado 4.9. Métodos algebraicos de reconstrucción 4.10. Reconstrucción por métodos iterativos 4.11. Métodos de Siddon 4.12. Algoritmo de Siddon 4.13. Singular Value Decomposition 4.14. Machine Learning 4.15. Máquinas de soporte vectorial (SVMs) 4.15.1. SVM para regresión 4.15.2. SVM para clasificación 4.16. Validación Cruzada 4.16.1. Validación cruzada Leave-one-out 4.16.2. Validación cruzada k iteraciones 4.17. Curva ROC 5. Metodología 5.1. Set de imágenes 5.2. Simulación de artificios 5.2.1. Movimiento del paciente 5.2.2. Anillos concéntricos 5.2.3. Endurecimiento del haz 5.2.4. Extracción de características 5.3. Aprendizaje de máquina 6. Resultados 7. Discusión de resultados 8. Conclusiones Pregrado Ingeniero en Biomédica Ingeniería Biomédica
- Published
- 2022
40. Sistema de recomendación basado en variables edáficas para el cultivo de plátano en el departamento de Risaralda
- Author
-
Posada Muñoz , Karen and Rodas Vásquez , Alejandro
- Subjects
Sistemas expertos ,Ingenieria de programas informáticos ,Agricultura ,Inteligencia artificial - Procesamiento de datos ,Sistema de recomendación ,000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores ,Aprendizaje de maquina ,Banana - Abstract
El cultivo de plátano es uno de los pilares de la agricultura Colombiana, graciasa sus bajos costes y su alto valor nutrimental, por ello se ubica como un alimento básico dentro de la canasta familiar del país. Sin embargo, el cultivo de plátano se enfrenta a una serie de retos dentro de su cadena de producción, siendo la falta de integración del campo con las tecnologías y su ineficacia a la hora de escoger un suelo adecuado, algunos de los problemas mayoritarios a los cuales se enfrenta la agricultura, muestra de ello son los bajos rendimientos históricos que se han presentado (Ministerio de agricultura y desarrollo rural, 2020; Sylvio Belalcázar Carvajal, 2012). No obstante, estas problemáticas no son exclusivas del territorio Colombiano, casos similares se han presentado con diversos cultivos en diferentesterritorios, siendo la tecnología una de las principales herramientas a la hora de mejorar el ejercicio agrícola en sus diferentes procesos. Por lo tanto, se propone el desarrollo de un sistema de recomendación basado en el contenido, el cual usa técnicas de Machine Learning con el fin de recomendar los suelos más adecuados para el cultivo de plátano en Risaralda de acuerdo a sus características edáficas Plantain cultivation is one of the pillars of Colombian agriculture, due to its low costs and its high nutritional value, making it a staple food in the country's family food basket. However, plantain cultivation faces a series of challenges within its production chain, being the lack of integration of the agriculture with technologies and its inefficiency when choosing a suitable soil, some of the main problems that Plantain crop faces, shows of this are the low historical yields that have been presented (Ministry of agriculture and rural development, 2020; Sylvio Belalcázar Carvajal, 2012). However, these problems are not exclusive to the Colombian territory; similar cases have occurred with various crops in different territories, with technology being one of the main tools when it comes to improving the agricultural exercise in its different processes. Therefore, the development of a content-based recommendation system is proposed, which uses Machine Learning techniques in order to recommend the most suitable soils for plantain cultivation in Risaralda according to its edaphic characteristics. Pregrado Ingeniero(a) de Sistemas y Computación Índice general Resumen III Lista de Figuras IV Lista de Tablas V 1 Introducción 1 2 Planteamiento del Problema 3 3 Justificación del Problema 5 4 Objetivos 7 4.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 4.2. Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . . . 7 5 Marco de Antecedentes 8 6 Marco Teórico 13 6.1. Sistemas de Recomendación . . . . . . . . . . . . . . . . . . . . . . 13 6.1.1. Calificaciones Explícitas e Implícitas . . . . . . . . . . . . . 16 6.2. Tipos de Sistemas de Recomendación . . . . . . . . . . . . . . . . . 18 6.2.1. Filtrado Colaborativo . . . . . . . . . . . . . . . . . . . . . 19 6.2.2. Filtrado Basado en el Contenido . . . . . . . . . . . . . . . . 23 6.2.3. Filtrado Híbrido . . . . . . . . . . . . . . . . . . . . . . . . . 28 7 Marco conceptual 30 7.1. Clima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 7.2. Suelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 i 7.2.1. Factores físicos . . . . . . . . . . . . . . . . . . . . . . . . . 31 7.2.2. Factores químicos . . . . . . . . . . . . . . . . . . . . . . . . 31 8 Metodología 33 8.1. Obtención de la información . . . . . . . . . . . . . . . . . . . . . . 33 8.2. Preprocesamiento de Datos . . . . . . . . . . . . . . . . . . . . . . . 33 8.3. Construcción del Modelo para el Agrupamiento de Cultivos(Items) . 34 8.3.1. Sintonización del Modelo de Agrupamiento . . . . . . . . . . 34 8.3.2. Tipos de Algoritmo de Agrupamiento . . . . . . . . . . . . . 34 8.3.3. Métricas de Evaluación del Modelo de Agrupamiento . . . . 34 8.4. Construcción del Modelo para el Sistema de Recomendación . . . . 35 8.4.1. Calculo de Similitudes . . . . . . . . . . . . . . . . . . . . . 35 8.4.2. Generación de Top-k Cultivos Recomendados . . . . . . . . 35 8.4.3. Métricas de Evaluación del Sistema de Recomendación . . . 36 8.5. Arquitectura del Sistema de Recomendación (Instanciación tecnológica) 36 9 Cronograma 37 10 Desarrollo del proyecto 38 10.1. Cultivo de plátano en el departamento de Risaralda . . . . . . . . . 38 10.2. Tecnologías para la implementación del sistema de recomendación . 38 10.3. Características relevantes del cultivo de plátano . . . . . . . . . . . 39 10.4. Conjunto de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 10.5. pre-procesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 10.6. Modelos de clasificación y regresión . . . . . . . . . . . . . . . . . . 41 10.6.1. Sintonización de hiperparametros . . . . . . . . . . . . . . . 41 10.6.2. Calculo de similitudes . . . . . . . . . . . . . . . . . . . . . 41 10.7. Arquitectura del sistema de recomendación . . . . . . . . . . . . . . 42 10.8. Evaluando el sistema de recomendación . . . . . . . . . . . . . . . . 42 11 Conclusiones 47 Bibliografía 48
- Published
- 2022
41. Evaluation of a demand aggregators model in the Colombian power system
- Author
-
Hincapié Correa, Julio Alejandro and Velásquez Henao, Juan David
- Subjects
Forecast models ,Sistemas eléctricos - Colombia ,Aprendizaje automático (Inteligencia artificial) ,Generación real ,004 - Procesamiento de datos Ciencia de los computadores [000 - Ciencias de la computación, información y obras generales] ,Machine learning ,629 - Otras ramas de la ingeniería [620 - Ingeniería y operaciones afines] ,Aprendizaje de máquina ,Modelos de pronóstico ,Demand aggregators ,Electrical systems - Colombia ,Agregadores de demanda ,Real generation - Abstract
ilustraciones, diagramas, tablas Este trabajo final de maestría presenta diferentes modelos de aprendizaje de máquina que buscan predecir la generación real de las plantas despachadas centralmente en el sistema eléctrico colombiano y a partir de ello la elaboración de portafolios de agregadores de demanda. Para esto, se obtuvieron datos históricos de diferentes variables que puedan afectar la generación, las cuales fueron verificadas, limpiadas, transformados y modeladas con diferentes técnicas estadísticas en Python. Los resultados obtenidos indican que el mejor modelo de aprendizaje de máquina para pronosticar la generación real con los datos obtenidos es el Random Forest, con un coeficiente de determinación de 93,5%. (Texto tomado de la fuenter) This final master's project presents different machine learning models that seek to predict the real generation of the centrally dispatched plants in the Colombian electricity system and from this, the preparation of portfolios of demand aggregators. For this, historical data of different variables that can affect the generation were obtained, which were verified, cleaned, transformed and modeled with different statistical techniques in Python. The results obtained indicate that the best machine learning model to predict the real generation with the data obtained is the Random Forest, with a coefficient of determination of 93.5%. Maestría Magíster en Ingeniería - Analítica Analítica Área Curricular de Ingeniería de Sistemas e Informática
- Published
- 2022
42. Caracterización del flujo en la arteria oftálmica ante cambios de presión, con base en el análisis automático de señales de ultrasonido de onda pulsada
- Author
-
Nieto Arias, Manuel Antonio and Serna Serna, Walter
- Subjects
Teoria del aprendizaje computacional ,Ultrasonido ,Presión intracraneal ,Aprendizaje supervisado ,510 - Matemáticas::515 - Análisis ,Teoria de las maquinas ,Aprendizaje de maquina - Abstract
La presión intracraneal (PIC) es una variable fisiológica relacionada a la dinámica circulatoria cerebral que cuando se encuentra de un rango de valores normales esta relacionada con un flujo continuo de sangre para el transporte de nutrientes y la oxigenación de tejidos. En el caso de que la PIC supera un rango normal da lugar a una hipertensión intracraneal (HIC), lo cual puede estar asociado a desbalances en el volumen interno o a alguna afección de las vías circulatorias, impidiendo un adecuado suministro de oxígeno a los tejidos cerebrales. Debido a que los métodos actuales para la medición cuantitativa de la PIC son invasivos, los especialistas deben estimar un estado del paciente a partir de otros signos. Por esto surge la necesidad de obtener una metodología de medición de la PIC que sea continuo y no invasivo, que permita evitar todos los posibles traumatismos de los métodos invasivos de medición. Por esto se busca caracterizar el comportamiento de la arteira oftálmica ante variaciones de presión externa, a través de la detección automática de los indices Doppler sobre la curva de velocidad de flujo sanguíneo y de esta forma permitir la implementación de nuevas metodologías para la medición de la PIC de manera no invasiva. Intracranial pressure (ICP) is a physiological variable related to cerebral circulatory dynamics that when it is a range of normal values, is related to a continuous flow of blood for the nutrients transportation and tissue oxygenation. In case that the ICP exceeds a normal range, it gives an intracranial hypertension (ICH), which may be associated with imbalances in the internal volume or some condition of the circulatory pathways, preventing an adequate supply of oxygen to the brain tissues. . Due to current methods for quantitative ICP measurement are invasive, specialists must estimate a patient's status from other signs. For this reason, it is necessary to adopt a methodology for measuring ICP that be continuous and non-invasive, which allows avoiding all the possible traumas of invasive measurement methods. In consequence, it is required to characterize the behavior of the ophthalmic artery under external pressure variations, through the automatic detection of the Doppler indices on the blood flow velocity curve and in this way allow the implementation of new methodologies for the measurement of the ICP non-invasively. Maestría Magíster en Instrumentación Física 1 Preliminares 1 1.1 Planteamiento del problema y justificaci´on . . . . . . . . . . . . . . . . . . . 1 1.2 Obejtivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.1 Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.2 Objetivos espec´ıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Marco te´orico 4 2.1 Presi´on Intracraneal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.2 Arteria Oft´almica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.3 Ultrasonido Doppler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.4 Procesamiento de im´agenes . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.5 ´Indices Doppler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.5.1 ´Indice de pulsatilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.6 Aprendizaje de M´aquina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.6.1 Tipos de Aprendizaje de M´aquina . . . . . . . . . . . . . . . . . . . . 10 3 Estado del arte 13 3.1 T´ecnicas de extracci´on de la curva de velocidad . . . . . . . . . . . . . . . . 13 3.2 C´alculo de los ´ındices Doppler . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3.3 Estimaci´on no invasiva de la PIC a trav´es de la correlaci´on de diferentes se˜nales cerebrales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 4 Metodolog´ıa 15 4.1 Extracci´on de la curva de velocidad . . . . . . . . . . . . . . . . . . . . . . . 16 4.2 Detecci´on de los ´ındices doppler . . . . . . . . . . . . . . . . . . . . . . . . . 19 4.3 Identificaci´on de anomal´ıas a partir de los ´ındices Doppler . . . . . . . . . . 22 x ´Indice general 5 Resultados 25 6 Conclusiones y Recomendaciones 30 Bibliograf´ıa 32
- Published
- 2022
43. Machine learning model to structure yellow machinery logs
- Author
-
Prado Gamba, Lina Fernanda, Gómez Jaramillo, Francisco Albeiro, and Computational Modeling of Biological Systems Research Group - COMBIOS
- Subjects
Natural language processing ,Information extraction ,Maintenance ,Maquinaria ,Maintenance logs ,Computational linguistics ,Machinery ,Aprendizaje automático (Inteligencia artificial) ,Procesamiento de lenguaje natural ,Machine learning ,Mantenimiento ,Aprendizaje de máquina ,Lingüística computacional ,519 - Probabilidades y matemáticas aplicadas [510 - Matemáticas] ,Registros de mantenimiento ,Extraccion de información - Abstract
ilustraciones, gráficas, tablas La falta de información relevante para la toma de decisiones es uno de los grandes problemas a los que se enfrentan los departamentos de mantenimiento en las empresas. Esta tesis explora un método automático para aportar a la solución de este problema mediante la extracción de información relevante de los registros históricos de las actividades de mantenimiento realizadas en los equipos. Dada la naturaleza de los datos, texto no estructurado con lenguaje técnico, se plantea la implementación de diferentes representaciones (bag of words, term frequency-inverse document frequency, Fasttext y Doc2vec) para alimentar los modelos de aprendizaje de ma ́quina que realizan la estructuración de información importante contenida en los documentos. En la búsqueda del modelo con mejor rendimiento se compararon modelos de support vector machine, random forest, gaussian naive bayes y gradient boosting trees. Estos modelos se aplicaron a datos provenientes de un negocio de venta y renta de maquinaria amarilla; se consideraron 12 montacargas de 3 modelos diferentes y 4 variables independientes en las cuales se extrae información: tipología, falla encontrada, estado final y sistema. Los modelos con mejor rendimiento alcanzaron un f1-score macro 0,86, 0,8, 0,81 y 0,68 con 3 support vector machine y un gradient boosting trees. Se concluye que para obtener mejores resultados el paso a seguir es aumentar la base de datos y expandir el campo de aplicación. (Texto tomado de la fuente). The lack of relevant information for decision-making is one of the major problems that maintenance departments face. In this thesis, an automatic method is explored to contribute to the solution of this problem by extracting relevant information from the records that are kept of the maintenance activities carried out on the equipment. Given the nature of the data, unstructured text with technical language, the implementation of different representations (bag of words, term frequency–inverse document frequency, Fasttext and Doc2vec) is proposed for the machine learning models that carry out the structuring of relevant information contained in the documents. In the search for the best performing model, support vector machine, random forest, gaussian naive bayes and gradient boosting trees models were compared. The models were applied to data from a business of sale and rental of yellow machinery; 15 forklifts of 3 different models and four independent variables in which information is extracted were considered: typology, fault found, final state and system. The best performing models achieved f1-score macro 0,86, 0,8, 0,81 y 0,68 with 3 support vector. Incluye anexos Maestría Magíster en Ciencias - Matemática Aplicada Aprendizaje de máquina Matemática aplicada
- Published
- 2022
44. Detection of traits in students with suicidal tendencies on Internet applying Web Mining
- Author
-
Castillo Zúñiga, Iván, Luna Rosas, Francisco Javier, and López Veyna, Jaime Iván
- Subjects
Recurrent neural networks ,Web mining ,Aprendizaje profundo ,Suicidal behavior ,Minería web ,Machine learning ,Conducta suicida ,Aprendizaje de máquina ,Cybersuicide ,Deep learning ,Cibersuicidio ,Redes neuronales recurrentes - Abstract
Este artículo presenta un modelo de análisis de datos en Internet basado en Minería Web con el objetivo de encontrar conocimiento sobre grandes cantidades de datos en el ciberespacio. A fin de probar el método propuesto, se analizaron páginas web sobre el suicidio como caso de estudio con la intención de identificar y detectar rasgos en estudiantes con tendencias suicidas. El procedimiento considera un Web Scraper para localizar y descargar información de Internet, así como técnicas de Procesamiento de Lenguaje Natural para la recuperación de los vocablos. Con el propósito de explorar la información, se construyó un conjunto de datos basado en Tablas Dinámicas y Ontologías Semánticas, especificando las variables predictivas en jóvenes con inclinación suicida. Por último, para evaluar la eficiencia del modelo se utilizaron algoritmos de Aprendizaje de Máquina y Aprendizaje Profundo. Cabe destacar que se optimizaron los procedimientos para la construcción del dataset (utilizando Algoritmos Genéticos) y obtención del conocimiento empleando Cómputo Paralelo y Aceleración con Unidades de Procesamientos de Gráfico (GPU). Los resultados revelan una precisión del 96,28% sobre la detección de las características en adolescentes con tendencia suicida, alcanzando el mejor resultado a través de una Red Neuronal Recurrente con un 98% de precisión. De donde se infiere que el modelo es viable para establecer bases sobre mecanismos de actuación y prevención de comportamientos suicidas, que pueden ser implementados en instituciones educativas o distintos actores de la sociedad, This article presents an Internet data analysis model based on Web Mining with the aim to find knowledge about large amounts of data in cyberspace. To test the proposed method, suicide web pages were analyzed as a study case to identify and detect traits in students with suicidal tendencies. The procedure considers a Web Scraper to locate and download information from the Internet, as well as Natural Language Processing techniques to retrieve the words. To explore the information, a dataset based on Dynamic Tables and Semantic Ontologies was constructed, specifying the predictive variables in young people with suicidal inclination. Finally, to evaluate the efficiency of the model, Machine Learning and Deep Learning algorithms were used. It should be noticed that the procedures for the construction of the dataset (using Genetic Algorithms) and obtaining the knowledge (using Parallel Computing and Acceleration with GPU) were optimized. The results reveal an accuracy of 96.28% on the detection of characteristics in adolescents with suicidal tendencies, reaching the best result through a Recurrent Neural Network with 98% accuracy. It is inferred that the model is viable to establish bases on mechanisms of action and prevention of suicidal behaviors, which can be implemented in educational institutions or different social actors
- Published
- 2022
- Full Text
- View/download PDF
45. Rational Agent Architecture to Recommend which Item to Buy in MOBA Videogames
- Author
-
Juan Guillermo, López Guzmán, Bustacara Medina, Cesar Julio, Florez Valencia, Leonardo, and Navarro Newball, Andrés Adolfo
- Subjects
Optimization ,Videojuegos ,Machine learning ,Maestría en inteligencia artificial - Tesis y disertaciones académicas ,Aprendizaje de máquina ,Videogames ,Agente racional ,Optimización ,Rational agent - Abstract
Los videojuegos multijugador de arena de batalla en línea (MOBA), es un genero de videojuegos que durante la última década han ganado popularidad en la escena competitiva de los E-Sports. Este incremento en su popularidad y la complejidad propia de los mismos han llamado la atención de investigadores en todas las áreas del conocimiento, incluyendo la Inteligencia Artificial. Dichos investigadores han utilizado una amplia variedad de técnicas de Aprendizaje de Maquina buscando mejorar la experiencia de diversos usuarios -jugadores novatos, jugadores expertos, espectadores, entre otros- a través de modelos de predicción, sistemas de recomendación y, aunque se han utilizado técnicas de optimización; estas últimas han sido las menos utilizadas en los videojuegos tipo MOBA. Por ello, el presente trabajo de investigación propone la arquitectura de un agente racional capaz de recomendar a un jugador que objeto comprar para aumentar sus probabilidades de ganar una partida, utilizando una técnica de optimización para la generación de recomendaciones. En la arquitectura propuesta, el agente percibe su ambiente con la información disponible en el API del videojuego League of Legends -uno de los MOBA mas populares actualmente-. Tal información es interpretada por una Regresión Logística que durante las etapas tempranas del juego demostró tener una precisión alrededor de 0.975. A su vez, la técnica de optimización seleccionada para generar la sugerencia fue GRASP; en promedio cada sugerencia es generada en 0.36 segundos, estas sugerencias durante la experimentación lograron aumentar la probabilidad de ganar una partida en promedio 5.2x. Multiplayer online battle arena (MOBA) video games are a genre of video games that during the last decade have gained popularity in the competitive E-Sports scene. This increase in popularity and MOBA’s complexity have attracted the attention of researchers in all areas of knowledge, including Artificial Intelligence (AI). AI researchers have used a wide variety of Machine Learning techniques seeking to improve the experience of various users - novice players, expert players, spectators, among others - through prediction models, recommendation systems and optimization algorithms. However, optimization algorithms have been the least used in MOBA videogames. For that reason, this research proposes the architecture of a rational agent capable of recommending to a player what item to buy to increase his probabilities of winning a game, using an optimization technique for generating recommendations. In the proposed architecture, the agent perceives his environment with the information available in the API of League of Legends -currently, one of the most popular MOBA videogames -. Such information is interpreted by a Logistic Regression that during the early stages of the game was shown to have an accuracy around 0.975. Additionally, the optimization technique selected to generate the suggestion was GRASP. On average each suggestion is generated in 0.36 seconds. During experimentation, these suggestions increase the probability of winning a game on average 5.2x. Magíster en Inteligencia Artificial Maestría
- Published
- 2021
46. Clasificación de los árboles bronquiales y caminos más transitados utilizando métodos de aprendizaje de máquina
- Author
-
Jiménez Prieto, Daniel Iván, Flórez Valencia, Leonardo, Posada Uribe, Luisa Fernanda, and Suárez Venegas, Daniel Ricardo
- Subjects
Artificial intelligence ,Aprendizaje no supervisado ,Maestría en inteligencia artificial - Tesis y disertaciones académicas ,Segmentación ,Mejoramiento de procesos ,Clasificación ,Classification ,Unsupervised learning ,Árbol bronquial ,Inteligencia artificial ,Algorithm ,Segmentation ,Bronchial tree ,Imágenes médicas ,Dijkstra ,Algoritmo ,Jenks natural breaks ,Machine learning ,Aprendizaje de máquina ,Vóxeles ,Medical imaging ,Voxels ,Pulmones ,Lungs ,Aprendizaje de máquinas - Abstract
Reconstruir, segmentar y clasificar el árbol bronquial ha sido de gran importancia en el área de la salud y la ingeniería, con un análisis adecuado podrían identificarse zonas afectadas por diversas enfermedades como cáncer de pulmón o Covid-19 para posteriormente tratarlas, ayudando tanto a sistemas de detección automática como a médicos y a personal de salud en campo. Dada la dificultad de obtener una imagen completa (normalmente tomografías computarizadas) sin errores y por la misma anatomía del pulmón, este problema ha sido atacado ampliamente mediante el procesamiento de imágenes médicas usando métodos de morfologías matemáticas y de crecimiento de regiones entre otros, pero aún no hay un método definitivo. En el presente trabajo se realizó una clasificación del árbol bronquial mediante un proceso de tres etapas, tomando como punto de partida una imagen binaria de los árboles bronquiales.Primero, se realizó un estudio e identificación de los puntos internos y externos de los árboles. Posteriormente se creó y utilizó un algoritmo de aprendizaje de máquina no supervisado, que tiene como base el algoritmo de Dijkstra, y finalmente se realizó un método de clasificación utilizando Jenks Natural Breaks para clasificar aquellas rutas más transitadas dentro de los árboles bronquiales. Reconstructing, segmenting, and classifying the bronchial tree has been of great importance in health and engineering areas, with accurate analysis areas affected by various diseases such as lung cancer or Covid-19 could be identified to treat them afterward, helping both, automated detection systems as doctors and health personnel in the field. Given the difficulty of obtaining a complete image (usually CT scans) without errors and because of the lung anatomy itself, this problem has been widely attacked by processing medical images using methods of mathematical morphologies and growth of regions among others, but still, there is no definitive method. In the present work, a classification of the bronchial tree was carried out through a three-stage process, taking as a starting point a binary image of the bronchial trees. First, a study and identification of the internal and external points of the trees was carried out. Subsequently, an unsupervised machine learning algorithm was created and used, based on the Dijkstra algorithm, and finally, a classification method was executed using Jenks Natural Breaks to classify those busiest routes within the bronchial trees. Magíster en Inteligencia Artificial Maestría
- Published
- 2021
47. Extraction and generation of linguistic resources in the banking domain in digital social networks
- Author
-
Martínez Sánchez, César Alexander, Díaz Prieto, Edinson Javier, Pajaro Hernandez, Juan Pablo, and Mora Correa, Juan Pablo
- Subjects
Ontología ,Lenguaje natural (Informática) ,Redes sociales digitales ,Ontology ,Natural language processing ,Redes sociales en línea ,Clasificación de temas ,Digital social networks ,Machine learning ,Aprendizaje de máquina ,Procesamiento del lenguaje natural ,Topic Classification ,Aprendizaje de máquinas ,Maestría en analítica para la inteligencia de negocios - Tesis y disertaciones académicas - Abstract
De acuerdo con el informe trimestral "Digital 2021 october global statshot report", el volumen de usuarios activos en internet en Colombia es del 68% de la población y el 76.4% son usuarios activos en redes sociales, bajo este contexto, las redes sociales han pasado de medio de información a medio de comunicación masivo, sin embargo, el crecimiento exponencial de la presencia tanto de usuarios como de las marcas en redes sociales, ha llevado a la necesidad del uso de la tecnología y los avances en la ciencia computacional, para extraer, recopilar y clasificar altos volúmenes de información relativa a la comunicación entre usuarios y marcas en el contexto digital.La revisión literaria ha mostrado importantes avances en investigaciones relacionadas con el análisis de datos semiestructurados y no estructurados, particularmente provenientes de redes sociales digitales, sin embargo, en Colombia no se encontraron investigaciones relacionadas, por lo tanto, se propone la implementación de esta prueba de concepto, que permitió clasificar los temas de conversación más frecuentes en el dominio bancario en la red social Twitter.La investigación se desarrolló bajo el marco ontológico, ya que a través de este podemos determinar las relaciones semánticas entre los conceptos del dominio financiero. El método de investigación utilizado es CRISP-DM. According to the quarterly report "Digital 2021 october global statshot report", the volume of active users on the internet in Colombia is 68% of the population and 76.4% are active users on social networks, in this context, social networks have gone from from being an information medium to a mass communication medium [2], however, the exponential growth of the presence of both users and brands in social networks has led to the need to use of technology and advances in computer science, to extract, collect and classify high volumes of information related to communication between users and brands in the digital context.The literary review has shown important advances in research related to the analysis of semi-structured and unstructured data, particularly from digital social networks, however, in Colombia there is no related research, therefore, the implementation of this proof of concept, which made it possible to classify the most frequent conversation topics in the banking domain on the social network Twitter.The research was developed under the ontological framework, since through this we can determine the semantic relationships between the concepts of the financial domain. Magíster en Analítica para la Inteligencia de Negocios Maestría
- Published
- 2021
48. Algorithmic stock trading through deep reinforcement learning
- Author
-
Giraldo Escobar, Santiago Alberto, Villa Garzón, Fernán Alonso, and Cortés Durán, Lina Marcela
- Subjects
Deep reinforcement learning ,Generative Adversarial Networks ,Stock trading ,Aprendizaje profundo ,629 - Otras ramas de la ingeniería [620 - Ingeniería y operaciones afines] ,Deep learning ,Negociación algorítmica ,Negociación de acciones ,Aprendizaje por refuerzo profundo ,003 - Sistemas [000 - Ciencias de la computación, información y obras generales] ,Machine learning ,Aprendizaje de máquina ,Redes Neuronales Generativas Adversarias ,Algorithmic trading - Abstract
ilustraciones, gráficos, tablas Este trabajo de grado tiene como finalidad explorar la utilización de series de tiempo financieras sintéticas generadas por un modelo de Redes Neuronales Generativas Adversarias (GAN por sus siglas en inglés) para entrenar un algoritmo de Aprendizaje Profundo Q Por Refuerzo que ejecute acciones de compra y venta para un título del mercado de valores del índice de Standard & Poor’s 500. Para el desarrollo del trabajo se empleó la metodología CRISP DM propuesta por IBM, entendiendo primero el negocio y la teoría necesaria para desarrollar los modelos, para continuar con la exploración y conocimiento de los datos disponibles que concordaran con los objetivos del estudio. En este se desarrolla un procedimiento para la selección de series ficticias y para el entrenamiento de un algoritmo por refuerzo con estos datos. Se utiliza la métrica de Kolmogorov - Smirnov como componente esencial para entrenar las redes GAN. Se explican los resultados de los experimentos, y se evidencia la dificultad para calibrar modelos generativos adversarios y de agentes entrenados por refuerzo. Por último, se presentan las conclusiones derivadas del trabajo y posibles investigaciones futuras. (Texto tomado de la fuente) This degree work aims to explore the use of synthetic financial time series generated by a Generative Adversarial Neural Networks (GAN) model to train a Deep Reinforcement Learning algorithm that executes buy and sell actions for a stock in the Standard & Poor's 500 index. For the implementation of the study, we used the CRISP methodology proposed by IBM, understanding first the business and the theory necessary to develop the models, to continue with the exploration and knowledge of the available data that matched the objectives of the project. In this paper, a procedure for selecting synthetic series and training a reinforcement algorithm with these data is developed. The Kolmogorov-Smirnov metric is used as an essential component to train GANs. The results of the experiments are explained, and the difficulty in calibrating generative adversarial and reinforcement network models is shown. Finally, conclusions derived from the project and possible future research are presented. Maestría Magíster en Ingeniería – Ingeniería de Sistemas Área Curricular de Ingeniería de Sistemas e Informática
- Published
- 2021
49. Computational Model for the analysis of clinical records of patients with Rheumatoid Arthritis applying translational bioinformatics and text mining
- Author
-
Del Risco Morales, Alexander, Niño Vasquez, Luis Fernando, Quintana Gerardo, and laboratorio de Investigación en Sistemas Inteligentes Lisi
- Subjects
Minería de textos ,Text mining ,Natural language processing ,616 - Enfermedades [610 - Medicina y salud] ,Artritis reumatoide ,003 - Sistemas [000 - Ciencias de la computación, información y obras generales] ,Procesamiento de lenguaje natural ,Machine learning ,Bioinformática traslacional ,Aprendizaje de máquina ,Snomed ,Rheumatoid arthritis ,Translational bioinformatics ,005 - Programación, programas, datos de computación [000 - Ciencias de la computación, información y obras generales] - Abstract
Documento en pdf con imágenes y texto Este trabajo tiene como finalidad crear un modelo computacional que permita identificar el avance de la enfermedad de artritis reumatoide (AR) con base en el análisis de historias clínicas de pacientes diagnosticados con Artritis Reumatoide. Se plantea que mediante la minería de texto, se puede extraer la información que permita a los profesionales del área identificar datos relevantes para el proceso de diagnóstico de AR y de esta forma hacer un diagnóstico temprano de la misma, así también, se pretende aplicar el concepto de bioinformática traslacional, esto implica que la información de valor y que cumpla con los objetivos propuestos de esta investigación pueda ser transferida de forma efectiva a los pacientes que sufren esta enfermedad. Se ha desarrollado un modelo que aplica minería de textos, recuperación de la información, lingüística computacional, aprendizaje de máquina y otras áreas del conocimiento relacionadas, que permiten transformar y tratar los datos no estructurados para poder hacer el análisis correspondiente de las historias clínicas y así descubrir conocimiento implícito inmerso en las narrativas de las historias clínicas que ayude con el propósito de tener más y mejor información asociada a la artritis reumatoide y la evolución de los pacientes. (Texto tomado de la fuente) The purpose of this work is to create a computational model that allows to identify the progression of rheumatoid arthritis (RA) disease based on the analysis of medical records of patients diagnosed with rheumatoid arthritis. It is proposed that through text mining, information can be extracted which allows professionals in the area to identify relevant data for the RA diagnosis process and thus make an early diagnosis, therefore, it is also intended to apply the concept of translational bioinformatics, which implies that valuable information that meets the proposed objectives of this research can be effectively transferred to patients suffering from this disease. A model has been developed that applies text mining, information retrieval, computational linguistics, machine learning and other related areas of knowledge, which allow the transformation and processing of unstructured data in order to carry out the corresponding analysis of medical records and thus discover implicit knowledge immersed in the narratives of medical records that helps with the purpose of having more and better information associated with rheumatoid arthritis and the evolution of patients. Maestría Magíster en Bioinformática Investigación cualitativa Bioinformática Departamento ingeniería de Sistemas e Industrial
- Published
- 2021
50. Contribution to the identification of potential antagonists associated with quorum sensing in Pseudomonas aeruginosa through chemoinformatic methods
- Author
-
Victoria Muñoz, Daniel Felipe, López Vallejo, Fabián, Productos Naturales Vegetales Bioactivos y Quimica EcoIogica, Medina-Franco Jose Luis, and Sánchez-Cruz Norberto
- Subjects
Pharmacology ,Protein-ligand interaction fingerprints ,Farmacología ,Cheminformatics ,Diseño de fármacos asistido por computadora ,Pharmaceutical technology ,Aprendizaje de maquina ,LasR / PqsR / RhlR ,Factores de transcripción ,540 - Química y ciencias afines ,Quorum sensing ,P. aeruginosa ,Pharmaceutical Preparations ,Computer-aided drug design ,Preparaciones Farmacéuticas ,Quimioinformatica ,Pseudomonas aeruginosa ,Molecular dynamics simulation ,Machine learning ,Transcriptional factors ,Tecnología farmacéutica ,Simulaciones de dinámica molecular - Abstract
ilustraciones, tablas, gráficas De acuerdo con el centro de control de enfermedades de los Estados Unidos (CDC’s) en su reporte de resistencia a antibióticos, las infecciones causadas por P. aeruginosa multi-fármaco resistente comprometieron alrededor de 32,600 pacientes y generaron 2,700 muertes durante el 2017. En Colombia el Sistema Nacional de Vigilancia de Resistencia Antimicrobiana (IAAS) en su informe del 2018 mostró que la P. aeruginosa es el patógeno con mayor recurrencia de la métalo β-lactamasa VIM en el territorio colombiano, alcanzando 840 casos contabilizados y dificultando el tratamiento de las infecciones de este patógeno. Como parte de la búsqueda de nuevas soluciones contra este patógeno, el mecanismo de comunicación intercelular denominado quorum sensing y los factores de transcripción que intervienen en él resultan ser blancos promisorios como adyuvantes en el tratamiento de infecciones por este patógeno. Por esta razón, en la presente investigación se seleccionaron los factores de transcripción LasR, PqsR y RhlR como blancos de estudio en el control de esta vía de comunicación. A través de la construcción de bases de datos con moléculas a las que se les ha demostrado su actividad biológica y su análisis mediante diversas herramientas del diseño de fármacos basado en el ligando, se encontraron múltiples características estructurales involucradas con la actividad contra estos factores de transcripción. Para LasR, anillos de 5 y 6 miembros (lactónicos y fenílicos), cadenas carbonadas de 10 o más carbonos, dos aceptores y un donador de puente de hidrogeno y el tamaño molecular superior a los 15 átomos fueron las características estructurales mínimas asociadas a moléculas con actividad sobre este factor. Adicionalmente se identificaron las interacciones con los residuos Tyr 47, ala 105, Thr 80, Leu 36, Ile 36, Ile 52 y Tyr 56 como posibles responsables de la actividad antagonista utilizando herramientas como fingerprints de interacción proteína-ligando y simulación de dinámicas molecular; siendo estos asociados al diseño de fármacos basado en la estructura. Los compuestos con actividad sobre PqsR exhibieron las siguientes características estructurales: biciclos nitrogenados de 6 miembros (quinoleína y quinazolina), cadenas alifáticas de un tamaño mínimo de 10 carbonos, mínimo un aceptor y donador de puente de hidrogeno y se debe igualar o superar a los 15 átomos; las interacciones con los aminoácidos que podrían estar involucrados en la actividad antagonista sobre este factor son: Tyr 258, Phe 221, Ala 102, Leu 207, Ile 149, siendo estas caracterizadas con los instrumentos del diseño e fármacos basado en la estructura. A partir de la base de datos construida para RhlR y los análisis quimioinformáticos se detectó que las moléculas con un anillo de 5 o 6 miembros (lactonas y fenilos), cadenas carbonadas de 3 a 6 carbonos; al menos 2 aceptores de puente de hidrogeno, 1 donador de puente de hidrogeno y que el conteo de átomos oscile entre 8 y 12. Como en las bases de datos públicas al momento no se encuentra elucidada la estructura terciaria de este factor de transcripción, en este trabajo se planteó y validó un modelo de estructura: con la anterior se procedió a hacer los análisis de fingerprints interacción proteína-ligando y la simulación de dinámica molecular para encontrar los residuos involucrados con la actividad antagonista, encontrado a las interacciones con la Val 60, Leu 69, Tyr 64, Tyr 72 y Ala 83 como las posibles responsables. Con el fin de complementar las características estructurales encontradas anteriormente, se crearon los farmacóforos a través del alineamiento estructural de las conformaciones obtenidas con los acoplamientos de las 10 moléculas con mejor actividad antagonista sobre cada uno de los factores de transcripción. Adicionalmente, se construyeron modelos de aprendizaje de maquina supervisados, donde los compuestos de la base de datos fueron clasificados como activos e inactivos y con el molecular fingerprint ECFP4 se caracterizó cada una de las moléculas para el entrenamiento posterior de 14 modelos; los cuales fueron clasificados según 6 métricas diferentes. De lo anterior se encontró que los mejores clasificadores fueron extreme gradient boosting y k-nearest neighbors classifier para todos los factores de transcripción y se propone el uso conjunto para la clasificación de los compuestos con posible actividad. Para integrar la información anterior, se realizó un cribado virtual sobre una base de datos molecular de productos naturales; encontrando a los compuestos: litseanolido C2, 1-hidroxi-3-metoxi-N-metil acridona y hematomato de metilo como los mejores clasificados para ser antagonistas contra LasR, PqsR y RhlR; además se identificó a las familias Rutaceae, Lauraceae y Piperaceae como una fuente potencial de compuestos con actividad contra estos factores de transcripción. (Texto tomado de la fuente). According to the United States Center for Disease Control (CDC's) in its report of antibiotic resistance, infections caused by multi-drug resistant P. aeruginosa affected around 32,600 patients and generated 2,700 deaths during 2017. In Colombia the National Antimicrobial Resistance Surveillance System (IAAS) in its 2018 report showed that P. aeruginosa is the pathogen with the highest recurrence of Metallo β-lactamase VIM in the Colombian territory, reaching 840 counted cases and making it difficult to treat the infections of this pathogen. As part of the search for new solutions against this pathogen, the intercellular communication mechanism called quorum sensing and the transcription factors involved in it turn out to be promising targets as adjuvants in the treatment of infections caused by this pathogen. For this reason, in this research, the transcription factors LasR, PqsR, and RhlR were selected as study targets in the control of this communication pathway. Through the construction of databases with active molecules. In this thesis using various tools of drug design based on the ligand, multiple structural characteristics involved with the activity against these transcription factors were found. For LasR, 5 and 6-membered rings (lactonic and phenyl), carbon chains of 10 or more carbons, two acceptors and a hydrogen bridge donor, and molecular size greater than 15 atoms were the minimum structural characteristics associated with molecules with activity on this factor. Additionally, interactions with residues Tyr 47, ala 105, Thr 80, Leu 36, Ile 36, Ile 52, and Tyr 56 were identified as possibly responsible for the antagonist activity using tools such as protein-ligand interaction fingerprints and molecular dynamics simulation; these being associated with structure-based drug design. Compounds with activity on PqsR exhibited the following structural characteristics: 6-membered nitrogenous bicycles (quinoline and quinazoline), aliphatic chains of a minimum size of 10 carbons, at least one hydrogen bridge acceptor and donor, and should equal or exceed those 15 atoms; the interactions with the amino acids that could be involved in the antagonist activity on this factor are: Tyr 258, Phe 221, Ala 102, Leu 207, Ile 149, being these characterized with the instruments of design and drugs based on the structure. From the database built for RhlR and the chemoinformatics analyzes, it was detected that molecules with a 5 or 6-membered ring (lactones and phenyl), carbon chains of 3 to 6 carbons; at least 2 hydrogen bridge acceptors, 1 hydrogen bridge donor, and that the atom count ranges between 8 and 12. As in the public databases at the moment the tertiary structure of this transcription factor is not elucidated. This work proposed and validated a structure model: with the previous one, we proceeded to do the analysis of protein-ligand interaction fingerprints and the simulation of molecular dynamics to find the residues involved with the antagonist activity, found in the interactions with Val 60, Leu 69, Tyr 64, Tyr 72 and Ala 83 as the possible culprits. In order to complement the structural characteristics, found previously, the pharmacophores were created through the structural alignment of the conformations obtained with the couplings of the 10 molecules with the best antagonist activity on each of the transcription factors. Additionally, supervised machine learning models were built, where the compounds in the database were classified as active and inactive, and with the molecular fingerprint ECFP4, each of the molecules was characterized for the subsequent training of 14 models; which were classified according to 6 different metrics. From the above, it was found that the best classifiers were extreme gradient boosting and k-nearest neighbor’s classifier for all transcription factors, and joint use is proposed for the classification of compounds with possible activity. To integrate the above information, virtual screening was performed on a molecular database of natural products; finding the compounds: C2 litseanolide, 1-hydroxy-3-methoxy-N-methyl acridone, and methyl hematomate as the best classified to be antagonists against LasR, PqsR, and RhlR; Furthermore, the Rutaceae, Lauraceae, and Piperaceae families were identified as a potential source of compounds with activity against these transcription factors. MinCiencias FPIT - Fundación para la promoción de la investigación y la tecnología Maestría Magíster en Ciencias Farmacéuticas Química medicinal y modelamiento molecular
- Published
- 2021
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.