209 results on '"Procesamiento de imagen"'
Search Results
2. Efecto de la coplanaridad entre cámara y hoja para la determinación de área foliar en Eichhornia crassipes con imágenes digitales.
- Author
-
Gómez Rodríguez, Alida Marcela, Carlos Garzón-Salcedo, Luis, Espinoza Manrique, Wilfred Edilberto, Cárdenas Castillo, Sergio Daniel, Guzmán Sanabria, Diomedes, and Bermúdez Duarte, David Felipe
- Subjects
IMAGE processing software ,IMAGE processing ,IMAGING systems ,CONFIDENCE intervals ,LEAF area - Abstract
Copyright of Revista Facultad de Ciencias Basicas is the property of Revista Facultad de Ciencias Basicas and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2020
- Full Text
- View/download PDF
3. Análisis de dispersión de fases en aleación Zn-22%Al-4%Ag mediante procesamiento de imágenes.
- Author
-
Vázquez Esquivel, Alexis Vaed, Aguilera Navarrete, Israel, Mondragón Sánchez, María de Lourdes, and Prado Lázaro, Juan Manuel
- Abstract
Copyright of Congreso Internacional de Investigacion Academia Journals is the property of PDHTech, LLC and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2019
4. Integration of trained AI models as a decision support system for age rating
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, López Martínez, Carlos, Felsberg, Michael, Aymerich Moreno, Clara, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, López Martínez, Carlos, Felsberg, Michael, and Aymerich Moreno, Clara
- Abstract
With the recently growing expansion and improvement of Artificial Intelligence (AI), it has been seen that it can be very useful to help humans make decisions, thus increasing efficiency, making decisions faster, and reducing the workload of human experts. In this thesis, we focus on how already trained Artificial Intelligence models can be used as a decision support system in the film industry sector, specifically for experts who set the age ratings of films. For the visual modality, the model SlowFast networks were used and for the audio modality, a standard ResNet model with 18 layers pretrained on Kinetics-400 was used. These audiovisual models have been trained on the Vidharm dataset, an open dataset of 3589 video clips from film trailers annotated by professionals. In this work we propose three systems with the objective of being applied in real life in the near future. We have statistically analyzed the data given by those AI models and we have related these data to the data given by a real human. Each one of the systems has its advantages and limitations. Still, in general, we have obtained satisfactory results even though having a better dataset with more clips or having models with better accuracy would have made the systems perform significantly better., Con la reciente expansión y mejora de la inteligencia artificial (IA), se ha podido ver que puede ser muy útil para ayudar a los humanos a tomar decisiones, aumentando así la eficiencia, a tomar decisiones más rápido y reducir la carga de trabajo de los humanos expertos. En esta tesis, nos enfocamos en cómo los modelos de Inteligencia Artificial ya entrenados pueden ser utilizados como sistema de apoyo a la toma de decisiones en el sector de la industria cinematográfica, específicamente para expertos que marcan la edad de las calificaciones de las películas. Para la modalidad visual se utilizó el modelo de redes SlowFast y para la modalidad de audio, un modelo ResNet estándar con 18 capas preentrenadas en Kinetics-400. Estos modelos audiovisuales han sido entrenados en el conjunto de datos de Vidharm, una base de datos de 3589 clips de videos de trailers de películas anotados por profesionales. En este trabajo propondremos tres sistemas con el objetivo de ser aplicados en la vida real en un futuro próximo. Hemos analizado estadísticamente los datos proporcionados por esos modelos de IA y los hemos relacionado con los datos proporcionados por un ser humano real. Cada uno de los sistemas tiene sus ventajas y limitaciones. Aún así, en general, hemos obtenido resultados satisfactorios a pesar de haber un mejor conjunto de datos con más clips o tener modelos con mayor precisión habría hecho que los sistemas funcionaran significativamente mejor., Amb la recent expansió i millora de la intel·ligència artificial (IA), s'ha pogut veure que pot ser molt útil per ajudar els humans a prendre decisions, augmentant així l'eficiència, a prendre decisions més ràpid i reduir la càrrega de treball dels humans experts. En aquesta tesi, ens enfoquem com els models d'Intel·ligència Artificial ja entrenats poden ser utilitzats com a sistema de suport a la presa de decisions al sector de la indústria cinematogràfica, específicament per a experts que marquen l'edat de les qualificacions de les pel·lícules. Per a la modalitat visual es va utilitzar el model de xarxes SlowFast i per la modalitat d'àudio, un model ResNet estàndard amb 18 capes preentrenades a Kinetics-400. Aquests models audiovisuals han estat entrenats al conjunt de dades de Vidharm, una base de dades de 3589 clips de vídeos de tràilers de pel·lícules anotats per professionals. En aquest treball proposarem tres sistemes amb l'objectiu de ser aplicats a la vida real en un futur proper. Hem analitzat estadísticament les dades proporcionades per aquests models d'IA i les hem relacionat amb les dades proporcionades per un ésser humà real. Cadascun dels sistemes té els seus avantatges i limitacions. Tot i així, en general, hem obtingut resultats satisfactoris tot i haver-hi un millor conjunt de dades amb més clips o tenir models amb més precisió hauria fet que els sistemes funcionessin significativament millor.
- Published
- 2023
5. Hacia una protonterapia adaptativa: Evaluando el potencial de la nnUNet para la segmentación de órganos en riesgo
- Author
-
Rodríguez González, B., Rodríguez Vila, B., Malpica, N., Torrado Carvajal, A., Rodríguez González, B., Rodríguez Vila, B., Malpica, N., and Torrado Carvajal, A.
- Abstract
La segmentación de órganos en riesgo es un proceso esencial en el tratamiento de protonterapia, especialmente en pacientes con cáncer de cabeza y cuello, donde la presencia de estructuras en riesgo es elevada. Debido a la necesidad de replanificación del tratamiento, así como a la gran carga de trabajo asociada a una delineación manual de las estructuras, es frecuente el uso de algoritmos automáticos de procesamiento de imagen para esta labor. En este marco se encuentra el trabajo propuesto, donde se prueba el potencial de la nnU-Net para la segmentación de 45 estructuras cerebrales. En este sentido, se entrenan cuatro modelos (un modelo bidimensional y tres tridimensionales a diferentes resoluciones) sobre 65 sujetos. Tras la comparación con métodos del estado del arte para la segmentación de estructuras cerebrales, destaca el potencial de la nnU-Net como herramienta para la segmentación de órganos en riesgo en la clínica, no solo por sus resultados, donde se obtiene un Coeficiente de Dice de 0.873 empleando arquitecturas tridimensionales; si no por su reducido tiempo de procesamiento (3:46min) y la robustez arrojada en la fase de test, donde se realiza una evaluación de incertidumbre con el objetivo de determinar la variabilidad de respuesta del modelo ante variaciones sistemáticas en la entrada.
- Published
- 2023
6. Movement in video classification using structured data : Workout videos application
- Author
-
Tabares Betancur, Marta Silvia, Múnera Muñoz, Jonathan Damián, Tabares Betancur, Marta Silvia, and Múnera Muñoz, Jonathan Damián
- Abstract
Nowadays, several video movement classification methodologies are based on reading and processing each frame using image classification algorithms. However, it is rare to find approaches using angle distribution over time. This paper proposes video movement classification based on the exercise states calculated from each frame's angles. Different video classification approaches and their respective variables and models were analyzed to achieve this, using unstructured data: images. Besides, structure data as angles from critical joints Armpits, legs, elbows, hips, and torso inclination were calculated directly from workout videos, allowing the implementation of classification models such as the KNN and Decision Trees. The result shows these techniques can achieve similar accuracy, close to 95\%, concerning Neural Networks algorithms, the primary model used in the previously mentioned approaches. Finally, it was possible to conclude that using structured data for movement classification models allows for lower performance costs and computing resources than using unstructured data without compromising the quality of the model.
- Published
- 2023
7. Volunteered Geographic Videos in Physical Geography: Data Mining from YouTube.
- Author
-
Lewis, Quinn W. and Park, Edward
- Subjects
- *
DATA mining , *PHYSICAL geography , *GEOGRAPHIC information systems , *IMAGE processing - Abstract
Volunteered geographic information and citizen science have advanced academic and public understanding of geographical and ecological processes. Videos hosted online represent a large data source that could potentially provide meaningful results for studies in physical geography—a concept we term volunteered geographic videos (VGV). Technological advances in image-capturing devices, computing, and image processing have resulted in increasingly sophisticated methods that treat imagery as raw data, such as resolving high-resolution topography with structure from motion or the calculation of surface flow velocity in rivers with particle image velocimetry. The ubiquitous nature of recording devices and citizens who share imagery online have resulted in a vast archive of potentially useful online videos. This article analyzes the potential for using YouTube videos for research in physical geography. We discuss the combination of suitability and availability that has made this possible and emphasize the distinction between moderately suitable imagery that can directly answer research questions and lower suitability imagery that can indirectly support a study. We present example case studies that address (1) initial considerations of using VGV, (2) topographic data extraction from a video taken after a landslide, and (3) data extraction from a video of a flash flood that could support a study of extreme floods and wood transport. Finally, we discuss both the benefits and complicating factors associated with VGV. The results indicate that VGV could be used to support certain studies in physical geography and that this large repository of raw data has been underutilized. [ABSTRACT FROM AUTHOR]
- Published
- 2018
- Full Text
- View/download PDF
8. A machine learning pose transfer system
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Ruiz Hidalgo, Javier, Cosano Serra, Marta, Izquierdo Bas, Sergi, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Ruiz Hidalgo, Javier, Cosano Serra, Marta, and Izquierdo Bas, Sergi
- Abstract
In recent years, the introduction of Machine Learning together with the use of conventional image processing techniques has given a boost to the generation of images. However, as these models are getting better their applications are getting very varied being applied in complex fields but also in daily people?s life. One of the main fields in which these new technologies are starting to be developed is fashion, especially on virtual try-on. The StageInHome company is trying to develop a virtual try-on system where people will be able to see how clothes fit them from only one single picture or selfie. This study attempts to provide an end-to-end framework based on Generative Adversarial Networks (GANs) that can provide different perspectives from a picture of a person. Specifically, it intends to provide a different human pose given a front pose of a human., En los últimos años, la introducción del Machine Learning junto con el uso de técnicas convencionales de procesamiento de imágenes ha dado un impulso a la generación de imágenes. Sin embargo, a medida que estos modelos van mejorando sus aplicaciones son cada vez más variadas aplicándose en campos complejos, pero también en la vida cotidiana de las personas. Uno de los principales campos en los que se están empezando a desarrollar estas nuevas tecnologías es el de la moda, especialmente en las pruebas virtuales. La empresa StageInHome está tratando de desarrollar un sistema de prueba virtual en el que las personas podrán ver cómo les queda la ropa a partir de una sola foto o selfie. Este estudio trata de proporcionar un marco integral basado en redes generativas antagónicas (GAN) que pueda proporcionar diferentes perspectivas a partir de una foto de una persona. En concreto, pretende proporcionar una pose humana diferente dada una pose frontal de un humano., En els darrers anys, la introducció del Machine Learning juntament amb l'ús de tècniques convencionals de processament d'imatges ha donat un impuls a la generació d'imatges. Tot i això, a mesura que aquests models van millorant les seves aplicacions són cada vegada més variades aplicant-se en camps complexos però també en la vida quotidiana de les persones. Un dels principals camps en què s'estan començant a desenvolupar aquestes noves tecnologies és el de la moda, especialment a les proves virtuals. L'empresa StageInHome està tractant de desenvolupar un sistema de prova virtual on les persones podran veure com els queda la roba a partir d'una sola foto o selfie. Aquest estudi intenta proporcionar un marc integral basat en xarxes generatives antagòniques (GAN) que pugui proporcionar diferents perspectives a partir d'una foto d'una persona. En concret, pretén proporcionar una posició humana diferent atesa una posició frontal d'un humà.
- Published
- 2022
9. Diseño de un Dispositivo Animatrónico como Herramienta de Apoyo en Tareas de Enseñanza
- Author
-
Avilés Sánchez, Oscar Fernando / Director, Durán Moncada, Andres Eduardo, Bernate Rodríguez, Brayan Camilo, Avilés Sánchez, Oscar Fernando / Director, Durán Moncada, Andres Eduardo, and Bernate Rodríguez, Brayan Camilo
- Abstract
Desde los inicios de los tiempos, la enseñanza ha sido base fundamental para que las generaciones puedan aprender y contribuir con la evolución de la raza humana. Existe un caso en específico donde el proceso de aprendizaje cognitivo suele ser un poco más lento en su capacidad de memoria y atención. Este caso en especial se presenta en las personas con síndrome de Down, las cuales nacen con un desorden genético en el cromosoma 21, el cual provoca un cromosoma 21 duplicado parcial o totalmente. El proyecto se orienta en la atención especializada en enseñar los colores primarios a los niños con síndrome de Down, mediante la interacción entre sus emociones y su aprendizaje. Esto se logra con un animatrónico que consideraran su mejor amigo en este proceso de enseñanza. Al brindarle a los niños una motivación y no una exigencia, se convierte en un proceso fácil y divertido. No solo aprenderán los colores primarios, sino que además se entretendrán con este nuevo apoyo. Se propone el diseño e implementación de un dispositivo animatrónico capaz de apoyar procesos de enseñanza a niños con Síndrome de Down en lo referente a los colores primarios. Para ellos se utilizarán herramientas de inteligencia artificial, de manera que el animatrónico sea capaz de interpretar comandos de voz y a su vez pueda generar gestos que indique si se ha tenido un acierto o un desacierto en el color escogido. De acuerdo con lo anterior se utilizarán técnicas de inteligencia artificial para el procesamiento de imágenes y comandos de voz. El agente de visión se encargará de procesar el color del objeto y guardarlo para hacer una posterior comparación con el agente de voz, el cual se encargará de escuchar la respuesta del niño y la almacenará con el fin de verificar si es correcto o incorrecto. Si es correcto, el animatrónico mostrará un gesto de carácter feliz y si es incorrecto el animatrónico mostrará un gesto de tristeza. Cabe aclarar que el animatrónico empieza con un gesto neutro para luego el
- Published
- 2022
10. Análisis automático de flujo de vídeo CCTV para la estimación de ocupación de mercancías en entornos portuarios
- Author
-
Ortega Hortas, Marcos, Universidade da Coruña. Facultade de Informática, Justo Armesto, Juan Andrés, Ortega Hortas, Marcos, Universidade da Coruña. Facultade de Informática, and Justo Armesto, Juan Andrés
- Abstract
[Resumen]: La industria portuaria ofrece un elevado potencial para el desarrollo socioeconómico local y regional por su situación estratégica para el intercambio de mercancías por vía marítima y terrestre. Con el avance en las tecnologías de la información y las comunicaciones, los puertos están avanzando hacia infraestructuras denominadas ”Smart Ports” o puertos inteligentes, que son plataformas para la gestión global e inteligente que permiten la integración y comunicación entre diferentes sistemas, facilitando la automatización de procedimientos complejos. En este contexto, dado el volumen de tráfico y mercancías, las tareas de vigilancia de las zonas de almacenamiento es crucial para garantizar la seguridad y la eficiencia en la operativa diaria del puerto. La monitorización activa de las zonas de ocupación de superficies es una tarea que consume tiempo y recursos, por lo que disponer de un sistema automático para este proceso proporcionaría una herramienta útil y fiable de apoyo a la videovigilancia. En este proyecto se propone un sistema automático basado en técnicas avanzadas de procesado de imagen e inteligencia artificial para la estimación de los porcentajes de ocupación de carga a partir de imágenes obtenidas por las cámaras Closed-Circuit Television (CCTV) en zonas de interés definidas en instalaciones portuarias. Con este fin, por un lado se consideran aproximaciones basadas en técnicas clásicas de aprendizaje máquina y por otro lado, se propone el uso de técnicas basadas en deep learning. Para determinar qué método es más apropiado para abordar este problema se ha realizado un estudio del impacto de diferentes configuraciones con conjuntos de datos formado por imágenes capturadas por las cámaras CCTV de diferentes instalaciones portuarias. Se ha realizado un análisis comparativo y se ha seleccionado el método que mejores resultados proporciona para este dominio de aplicación. Adicionalmente, el método seleccionado ha sido integrado en un servicio de vi, [Abstract]: The port industry offers a high potential for local and regional socio-economic development due to its strategic location for the exchange of goods by sea and land. With the advances in information and communication technologies, ports are moving towards infrastructures known as ”Smart Ports”, which are platforms for global and intelligent management that allow integration and communication between different systems, facilitating the automation of complex procedures. In this context, given the volume of traffic and goods, the surveillance of storage areas is crucial to guarantee security and efficiency in the port’s daily operations. The active monitoring of surface occupation zones is a time-consuming and resource-intensive task, so having an automatic system for this process would provide a useful and reliable tool to support video surveillance. This project proposes an automatic system based on advanced image processing and artificial intelligence techniques for estimating the percentages of cargo occupancy from images obtained by Closed-Circuit Television (CCTV) cameras in defined areas of interest in port facilities. To this end, on the one hand, approaches based on classical machine learning techniques are considered and, on the other hand, the use of techniques based on deep learning is proposed. In order to determine which method is more appropriate to address this problem, a study of the impact of different configurations with datasets composed of images captured by the CCTV cameras of different port facilities has been performed. A comparative analysis has been carried out and the method that provided the best results for this application domain has been selected. Additionally, the selected method has been integrated into a video surveillance service providing a support tool that allows the reliable and objective monitoring of surface occupation zones in a real environment.
- Published
- 2022
11. Diseño, desarrollo e implementación de un servicio web para la anotación de imágenes de alta resolución: Integración de modelos de Deep Learning para la segmentación automática de regiones
- Author
-
Pulgarín Ospina, Cristian Camilo
- Subjects
Serveis Web ,Aprendizaje profundo ,Digital Pathology ,Desarrollo web ,Patología digital ,Explotació de dades ,Patologia Digital ,Procesamiento de imagen ,Servicios Web ,Explotación de datos ,Big data ,Data Explotation ,Deep Learning ,Processament d’imatge ,Web Services ,Crowdsourcing ,Images Processing ,Máster Universitario en Gestión de la Información-Màster universitari en Gestió de la Informació ,LENGUAJES Y SISTEMAS INFORMATICOS ,Aprenentatge profund - Abstract
[CA] La societat actual està molt digitalitzada, gràcies a això s’aconsegueix generar immenses quantitats de dades que si són analitzats aporten molta informació que pot ser usada per a realitzar importants avanços en múltiples camps, un d’aquestos camps es el de la salut, prova d’això és la revolució digital en mètodes clínics com l’estudi histològic d’imatges tumors, el paradigma en el Workflow de la patologia tradicional ha fet que s’estandarditze l’ús d’imatges digitals Whole Slide Images en detriment de les mostres microscòpiques, això es deu en gran part a la quantitat de beneficis que aquest metode presenta, una d’ells e l’ús de programes que permeten la visualització de imatges a nivell de píxel amb un nivell de qualitat òptim. El grup CVBlab ofereix una eina per a la visualització de les imatges WSI que a més té funcionalitats per a anotar imatges, aquesta aplicació té l’objectiu de facilitar l’anotació als patòlegs pera generen bases de dades robustes amb les quals entrenar models de Deep Learning, el problema és que aquest sistema té dificultats per a donar un servei òptim al volum de casos que es volen avaluar i a més no estan implementades noves funcionalitats que són necessàries per ajustar-se a l’exigència de determinats projectes, una d’elles és la implementació de models de Deep Learning en la pròpia aplicació per a avaluar-los amb metodologies Crowdsourcing,en aquest context es realitzat una anàlisi minuciosa de la infraestructura i el codi per a buscar millores i sintetitzar una estratègia de banyara d’aquesta, a més s’han dissenyat i implementat noves extensions que permeten integrar models de DeepLearning i fer tasques de Crowdsourcing, [ES] La sociedad actual está muy digitalizada, gracias a esto se consigue generar inmensas cantidades de datos que si son analizados aportan mucha información que puede ser usada para realizar importantes avances en múltiples campos, uno de estos campos es él de la salud, prueba de ello es la revolución digital en métodos clínicos como el estudio histológico de imágenes tumores, el paradigma en el Workflow de la patología tradicional hahechoqueseestandariceelusodeimágenesdigitalesWholeSlide Images en detrimento de las muestras microscópicas, esto se debe en gran parte a la cantidad de beneficios que plantes, una de ellas es el uso de software que permiten la visualización de las imágenes a nivel de píxel con un nivel de calidad óptimo. El grupo CVBlab ofrece una herramientas para la visualización de las imágenes WSI que además tiene funcionalidades para anotar imágenes, esta aplicación tiene el objetivo de facilitar la anotación a los patólogos para generar bases de datos robustas con las que entrenar modelos de Deep Learning, el problema es que este sistema tiene dificultades para dar un servicio óptimo al volumen de casos que se quieren evaluar y además no están implementadas nuevas funcionalidades que son necesarias para que ajustarse a la exigencia de determinados proyectos, una de ellas es la implementación de modelos de Deep Learning en la propia aplicación para evaluarlos con metodologías Crowdsourcing, en este contexto se ha realizado un análisis minuciosodelainfraestructura yelcódigoparabuscarmejorasysintetizarunaestrategia de mojara de la misma, además se han diseñado e implementado novedosas extensiones que permiten integrar modelos de Deep Larning y realizar tareas de Crowdsourcing., [EN] Today’s society is highly digitalized, thanks to this, it is possible to generate immense amounts of data which, if analyzed, provide a great deal of information that can be used to make significant advances in many fields, one of these fields is health, proof of which is the digital revolution in clinical methods such as the histological study tumor images, the paradigm in the workflow of traditional pathology has led to the standardization of the use of digital images to the detriment of microscopic samples, this is mainly due to the number of benefits that they offer, one of which is the use of software that allows the visualization of images at pixel level with an optimum level of quality. The CVBlab group provides tools for the visualization of WSI images that also has functionalities for anotatinging images. This application aims to facilitate annotation for pathologists in order to generate robust databases with which to train Deep Learning models, The problem is that this system has difficulties to provide an optimal service to the volume of cases to be evaluated and also new functionalities that are necessary to meet the requirements of certain projects are not implemented, one of them is the implementation of Deep Learningmodelss in the application itself to evaluate them with Crowdsourcing methodologies. In this context, a thorough analysis of the infrastructure and code has been carried out in order to search for improvements and synthesize a strategy for its wetting, in addition, novel extensions have been designed and implemented to integrate models of crowdsourcing and crowdsourcing tasks.
- Published
- 2022
12. Un sistema de transimissió de pose basat en aprenentatge automàtic
- Author
-
Izquierdo Bas, Sergi, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Ruiz Hidalgo, Javier, and Cosano Serra, Marta
- Subjects
Imatges--Processament ,Image processing ,Machine learning ,Aprenentatge automàtic ,Enginyeria de la telecomunicació::Processament del senyal::Processament de la imatge i del senyal vídeo [Àrees temàtiques de la UPC] ,Aprendizaje automático ,procesamiento de imágen - Abstract
In recent years, the introduction of Machine Learning together with the use of conventional image processing techniques has given a boost to the generation of images. However, as these models are getting better their applications are getting very varied being applied in complex fields but also in daily people?s life. One of the main fields in which these new technologies are starting to be developed is fashion, especially on virtual try-on. The StageInHome company is trying to develop a virtual try-on system where people will be able to see how clothes fit them from only one single picture or selfie. This study attempts to provide an end-to-end framework based on Generative Adversarial Networks (GANs) that can provide different perspectives from a picture of a person. Specifically, it intends to provide a different human pose given a front pose of a human. En los últimos años, la introducción del Machine Learning junto con el uso de técnicas convencionales de procesamiento de imágenes ha dado un impulso a la generación de imágenes. Sin embargo, a medida que estos modelos van mejorando sus aplicaciones son cada vez más variadas aplicándose en campos complejos, pero también en la vida cotidiana de las personas. Uno de los principales campos en los que se están empezando a desarrollar estas nuevas tecnologías es el de la moda, especialmente en las pruebas virtuales. La empresa StageInHome está tratando de desarrollar un sistema de prueba virtual en el que las personas podrán ver cómo les queda la ropa a partir de una sola foto o selfie. Este estudio trata de proporcionar un marco integral basado en redes generativas antagónicas (GAN) que pueda proporcionar diferentes perspectivas a partir de una foto de una persona. En concreto, pretende proporcionar una pose humana diferente dada una pose frontal de un humano. En els darrers anys, la introducció del Machine Learning juntament amb l'ús de tècniques convencionals de processament d'imatges ha donat un impuls a la generació d'imatges. Tot i això, a mesura que aquests models van millorant les seves aplicacions són cada vegada més variades aplicant-se en camps complexos però també en la vida quotidiana de les persones. Un dels principals camps en què s'estan començant a desenvolupar aquestes noves tecnologies és el de la moda, especialment a les proves virtuals. L'empresa StageInHome està tractant de desenvolupar un sistema de prova virtual on les persones podran veure com els queda la roba a partir d'una sola foto o selfie. Aquest estudi intenta proporcionar un marc integral basat en xarxes generatives antagòniques (GAN) que pugui proporcionar diferents perspectives a partir d'una foto d'una persona. En concret, pretén proporcionar una posició humana diferent atesa una posició frontal d'un humà.
- Published
- 2022
13. Introduction to Artificial Vision through Laboratory Guides Using Matlab
- Author
-
Verónica Londoño-Osorio, Jhovana Marín-Pineda, and Eliana I. Arango-Zuluaga
- Subjects
Prácticas de laboratorio ,procesamiento de imagen ,visión artificial ,interfaz gráfica de usuario (GUI) ,educación en ingeniería. ,Technology ,Engineering (General). Civil engineering (General) ,TA1-2040 - Abstract
This paper presents the design of two laboratory guides in artificial vision for a course which aims to introduce students to the different areas of specialization of his career. Therefore, the designed practices motivate and provide relevant content to the student, and to encourage research in the area of image processing. The first guide presents an introductory practice that explores the basic commands for image processing by programming a GUI in Matlab, and a second practice in which you use an image recognition algorithm, which compares the color characteristics of facial or objects images. The discussion of the results, challenges and recommendations for the development of each practice session are explained. The survey answers of the students are displayed. This survey allows checking their level of acceptance for the design and content of practice and motivation to continue studying in the image processing area. Finally, comparisons with laboratory guides that were designed in other universities are made.
- Published
- 2013
14. Desarrollo de un sistema de estándar abierto para el diagnóstico de maquinaria industrial rotativa y reciprocante utilizando análisis continuo de armónicos de frecuencia
- Author
-
Gómez Chito, Herman Maicoll and Perafán Villota, Juan Carlos
- Subjects
Artificial intelligence ,Espectrograma ,Computer software - Development ,Desarrollo de software ,Electric motors ,Pronóstico ,Deep learning ,Modo de falla ,Procesamiento de imagen ,Inteligencia artificial ,Machine learning ,Motores eléctricos ,Prototipo analítico ,Maestría en Ingeniería de Desarrollo de Productos ,Patrón de falla ,Modulación de frecuencia - Abstract
Todas las empresas requieren tener un proceso productivo estable y confiable que les permita planear una estrategia para competir en el mercado, dentro esta necesidad es muy importante saber el estado de las maquinas que ejecutan los procesos, ya que de esta manera se planea la producción y el mantenimiento de las mismas. Con el objetivo de desarrollar una herramienta de hardware y software que permita la generación de un diagnóstico confiable sobre la salud de la maquinaria se realizaron múltiples pruebas para evaluar la condición de un equipo de pruebas de manera manual y posteriormente se implementa una herramienta que es capaz de realizar el diagnostico de manera automática utilizando análisis de señales y aprendizaje autónomo donde se logra identificar de manera adecuada la condición de un equipo en 3 categorías. Los resultados evidencian que pese a que la cantidad de datos puede ser poca y que las categorías pueden estar desbalanceadas es posible construir un modelo de aprendizaje automático a través del uso del aprendizaje profundo y el análisis continuo de armónicos de frecuencia. Proyecto de grado (Magíster en Ingeniería de Desarrollo de Productos)-- Universidad Autónoma de Occidente, 2022 Maestría Magíster en Ingeniería de Desarrollo de Productos
- Published
- 2022
15. Aplicativo educativo para el reconocimiento básico del lenguaje de signos ecuatoriano
- Author
-
Franco Candelejo, Omar Isaac, Guerrón Pérez, Johan Lenin, and Cevallos Robalino, Lenin Estuardo
- Subjects
PROCESAMIENTO DE IMAGEN ,SOFTWARE EDUCATIVO ,LENGUA DE SEÑAS ECUATORIANA (LSEC) ,VISIÓN ARTIFICIAL ,RED NEURONAL CONVOLUCIONAL - Abstract
En este artículo se presenta el desarrollo de una herramienta software para dar soporte dentro del proceso de enseñanza-aprendizaje acerca de lenguaje de señas y signos ecuatorianos para personas con discapacidad auditiva, familiares y convivientes. This article presents the development of a software tool that supports the teaching-learning process about Ecuadorian sign language for people with hearing disabilities, family members and cohabitants.
- Published
- 2022
16. Design and Implementation of a Methodology based on Artigicial Inteligence Capable to Counting and Classifying Vehicles at Airport Accesses and Recognizing Airport Vehicles
- Author
-
Martínez Samper, Aniceto José
- Subjects
Artificial intelligence ,Aprendizaje profundo ,Deep learning ,Redes neuronales ,Procesamiento de imagen ,Inteligencia artificial ,INGENIERIA E INFRAESTRUCTURA DE LOS TRANSPORTES ,Image processing ,Máster Universitario en Ingeniería Aeronáutica-Màster Universitari en Enginyeria Aeronàutica ,Vehicle classification ,YOLO ,Clasificación de vehículos ,Neural networks - Abstract
[ES] Actualmente, el tráfico es parte de un problema a nivel mundial. Existe un crecimiento muy acelerado, creando un problema notable en la sociedad. Es conveniente realizar un estudio de crecimiento de vehículos a lo largo de los años para contrastar el rápido crecimiento de la circulación. Este proyecto se basa en realizar un conteo y una clasificación automática de vehículos, capaz de poder acoplarse a cualquier video de circulación. Particularizando un poco más, este proyecto se va a centrar principalmente en la composición de un algoritmo para el conteo y clasificación de vehículos en las entradas de aeropuertos. Siendo capaz de poder obtener una clasificación total durante una jornada de tiempo establecida de los vehículos que han transitado el aeropuerto, para conocer la ocupación y demanda aeroportuaria. En el presente trabajo se realizará el algoritmo de implementación, pero no se realizará el estudio del tránsito de vehículos. Posteriormente, se realizará un entrenamiento del algoritmo para ser capaz de reconocer vehículos aeroportuarios y llevar a cabo un control del tránsito en los aeropuertos. De esta forma, se puede conocer su ubicación en tiempo real y la posible necesidad de introducir nuevos vehículos. Para realizar este estudio, se ha trabajado con el lenguaje de programación open CV. Donde se irá evolucionando el programa hasta poder conseguir un resultado óptimo, partiendo de una programación más simple, pasando por métodos básicos de procesamiento de imagen y finalizando en la implementación de redes neuronales (YOLO) para la detección y clasificación de objetos., [EN] Traffic is currently part of a global problem. There is a very accelerated traffic growth creating a big problem in society. It is appropriate to develop a study of vehicle growth over the years to compare how fast the traffic growth. This proyect is based on vehicle automatic counting and classification, being able to be adapted to any traffic video. Specifically, this proyect will be focused mainly in a algorithm composition to vehicle counting and classification at airport¿s entrance. It will be able to obtain a total vehicle classification during a day, to determinate airport demand and occupation. On the other hand, the algorithm will be trained to be able to recognize airport vehicles and carry out a traffic control. In addition, the location can be known in real time and there is the posibility to introduce new vehicles. The programming language in this proyect is OpenCV. The algotithm will evolve to achieve and optimal solution, starting from a easy and simpler programming, going through basic image processing methods and ending with the implementation of a neural network (YOLO).
- Published
- 2022
17. Generación de Pixel Art mediante inteligencia artificial y creación de NFTs en la blockchain de Oasis Network
- Author
-
Martín Dos Santos, Ricardo, Universitat Autònoma de Barcelona. Escola d'Enginyeria, and Roca Marva, Francesc Xavier
- Subjects
Blockchain ,Artificial Intelligence ,Image Processing ,Intel·ligència Artificial ,NFT ,Pixel Art ,Inteligencia Artificial ,Procesamiento de imagen ,Processament d'imatge - Abstract
Es presenta el desenvolupament d'una aplicació per crear píxel arts a partir de qualsevol imatge bidimensional aplicant diferents tècniques de processament d'imatge basades en Intel·ligència Artificial, incloent Computer Vision, Machine Learning i Deep Learning. Per als respectius pixel arts farem el procés de convertir un fitxer digital a un token no fungible (NFT) i prepararem un entorn perquè l'encunyació d'aquests sigui possible. El primer objectiu és construir una versió inicial d'aquesta aplicació en un entorn local perquè en un futur es pugui arribar a escalar a un entorn cloud i crear una eina autogestionada de creació d'avatars a través d'una pàgina web. Un cop tenim l'aplicació, mitjançant l'ús d'aquesta crearem una col·lecció d'imatges pixel art, i amb aquestes imatges crearem NFTs a la blockchain d'Oasis Network utilitzant l'Emerald ParaTime perquè així puguem tenir cada NFT en una adreça Ethereum-compatible. Quan tinguem la col·lecció a la blockchain crearem una pàgina web amb l'objectiu d'emular l'encunyació de cada NFT, a la interfície d'aquesta podrem enllaçar una cartera de criptomonedes de tipus programari com per exemple Metamask per interactuar amb aquesta blockchain d'una manera accessible i intuïtiva. Se presenta el desarrollo de una aplicación para crear pixel arts a partir de cualquier imagen bidimensional aplicando diferentes técnicas de procesamiento de imagen basadas en Inteligencia Artificial, incluyendo Computer Vision, Machine Learning y Deep Learning. Para los respectivos pixel arts haremos el proceso de convertir un archivo digital a un token no fungible (NFT) y prepararemos un entorno para que la acuñación de estos sea posible. El primer objetivo es construir una versión inicial de esta aplicación en un entorno local para que en un futuro se pueda llegar a escalar a un entorno cloud y así crear una herramienta autogestionada de creación de avatares a través de una página web. Una vez tenemos la aplicación, mediante el uso de esta crearemos una colección de imagenes pixel art, y con estas imágenes crearemos NFTs en la blockchain de Oasis Network utilizando el Emerald ParaTime para que así podamos tener cada NFT en una dirección Ethereum-compatible. Cuando tengamos la colección en la blockchain crearemos una página web con el objetivo de emular la acuñación de cada NFT, en la interfaz de esta podremos enlazar una billetera de criptomonedas de tipo software como por ejemplo Metamask para interactuar con esta blockchain de una manera accesible e intuitiva. It presents the development of an application to create pixel arts from any two-dimensional image applying different image processing techniques based on Artificial Intelligence, including Computer Vision, Machine Learning and Deep Learning. For the respective pixel arts we will do the process of converting a digital file to a non-fungible token (NFT) and we will prepare an environment so that the minting of these is possible. The first objective is to build an initial version of this platform in a local environment so that in the future it can be scaled to a cloud environment and thus create a self-managed tool for creating avatars through a web page. Once we have the platform, by using it we will create a collection of pixel art images, and with these images we will create NFTs on the Oasis Network blockchain using the Emerald ParaTime so that we can have each NFT in an Ethereum-compatible address. When we have the collection in the blockchain we will create a web page with the aim of emulating the mint of each NFT, in its interface we will be able to link a software-type cryptocurrency wallet such as Metamask to interact with this blockchain in an accessible and intuitive way.
- Published
- 2022
18. Conteo y reconocimiento de actividad de personas en un recinto mediante image processing
- Author
-
Arellano Ramírez, Juan Felipe and Zurek, Eduardo
- Subjects
Reconocimiento de actividad humana ,HAR ,dispositivos integrados ,people counting ,procesamiento de imagen ,conteo de personas ,Human activity recognition ,embedded ,image processing - Abstract
With the Covid-19 pandemic overcrowdedness in closed spaces becomes a main issue to manage, specially in places with high transit of people like universities, malls, public offices, etc. With the help of image processing it is going to be developed a algorithm that will provide real time data on occupation of specific places, also it is going to provide a activity monitor tagging people in the same room and what they are doing. This data will be exposed through standard interfaces to be consumed by information systems. Finally the objective is deploying this on embedded systems. Also it is going to be developed a dashborad to be able to visualise the data that is been processed in realtime. The extend of this project is mainly scoped under the university use case but it can be extended to other public places like malls, public offices, hospitals and more. Using this technics opens possibilities to make better decisions on space optimisation and give realtime data for users that share this types of spaces. Con la pandemia Covid-19 el hacinamiento en espacios cerrados se convierte en un tema principal a gestionar, especialmente en lugares con alto tránsito de personas como universidades, centros comerciales, oficinas públicas, etc. Con la ayuda del procesamiento de imágenes se va a desarrollar un algoritmo que proporcionará datos en tiempo real sobre la ocupación de lugares específicos, también proporcionará un monitor de actividad que etiquete a las personas en la misma habitación y lo que están haciendo. Estos datos serán expuestos a través de interfaces estándar para ser consumidos por los sistemas de información. Finalmente, el objetivo es implementar esto en sistemas integrados. También se va a desarrollar un tablero para poder visualizar los datos que se procesan en tiempo real. La extensión de este proyecto se enmarca principalmente en el caso de uso universitario, pero puede extenderse a otros lugares públicos como centros comerciales, oficinas públicas, hospitales y más. El uso de esta técnica abre posibilidades para tomar mejores decisiones sobre la optimización del espacio y brindar datos en tiempo real para los usuarios que comparten este tipo de espacios.
- Published
- 2021
19. Identification of furrows, follow and mapping of crops supported by an aerial platform
- Author
-
Prieto Pedraza, Diego Alejandro, Solaque Guzmán, Leonardo Enrique, and Riveros Guevara, Adriana
- Subjects
plataforma aérea ,inteligencia artificial ,seguimiento ,DETECCION POR RADAR ,detection ,simulación ,surco ,furrow ,mapa ,simulation ,artificial intelligence ,follow ,image processing ,CULTIVOS ,PROCESAMIENTO DE IMAGENES ,cultivo ,map ,A ,procesamiento de imagen ,crop ,YOLO ,detección ,obstacle ,obstáculo ,aerial platform - Abstract
Dada la importancia que representa el sector agrícola para Colombia y los distintos avances e investigaciones que se han realizado con respecto a la agricultura de precisión, para el presente proyecto se decidió hacer uso de tecnologías que permitieran realizar la exploración de un cultivo simulado, apoyado en un vehículo aéreo. En este trabajo se emplearon técnicas de procesamiento de imagen (Operaciones morfológicas, segmentación por color, filtro de promedio) y algoritmos de inteligencia artificial (redes convolucionales, YOLOv4) para identificar líneas de cultivo y posibles obstáculos que se puedan encontrar en un cultivo simulado, estas imágenes fueron obtenidas a partir de una cámara embarcada en un dron. A medida que se realiza este proceso, se genera una trayectoria la cual es seguida por el dron para posteriormente continuar con la toma de imágenes y el desplazamiento hasta llegar al final de cultivo. Los datos de ubicaciones de los surcos, trayectoria y obstáculos son guardados para ser procesados y generar un mapa. Como resultado se obtuvo una precisión de validación de 0.87 en la detección de elementos del cultivo y una precisión en la detección de obstáculos de 0.91. La trayectoria generada mediante la identificación de surcos y el uso del algoritmo A* fue óptima para evadir los obstáculos presentes en el cultivo. Finalmente, las gráficas de error en el desplazamiento del vehículo aéreo con respecto a las posiciones deseadas tienden a un valor de 0. Estos resultados permitirán brindar información del cultivo a la plataforma terrestre Ceres_Agrobot. 1. Introducción 9 2. Planteamiento del problema 11 3. Objetivos 12 3.1. Objetivo General 12 3.2. Objetivos Específicos 12 4. Estado del arte 13 4.1. Aplicación de los drones en investigación 14 4.2. Algoritmos usados en conjunto con UAVs 15 4.3. SLAM 15 4.4. Procesamiento de imagen 18 4.4.1. Incidencia de las condiciones de iluminación 21 5. De la simulación y sus elementos 27 5.2. El ambiente de simulación 28 5.3. El cultivo en Gazebo: 28 5.4. El hexacóptero 29 5.5. Integración con la cámara 29 5.6. El desplazamiento de la aeronave 30 6. De la detección de cultivos 32 6.1. Segmentación de grises por valor umbral 32 6.2. Segmentación de colores - Matlab 34 6.3. Operaciones morfológicas 36 6.3.1. Erosión 36 6.3.2. Dilatación 38 6.4. Filtro de promedio 40 6.5. Segmentación por valor umbral II 41 7. Las texturas y cultivos con bolsas de plástico 43 7.1. Segmentación de textura por filtro de Gabor 43 7.2. Segmentación de textura por filtro de entropía 44 7.3. Matriz de co-ocurrencia GLCM 45 7.4. División de imagen y clasificación de texturas 48 7.5. Red Neuronal para propiedades de imagen – matriz de co-ocurrencia 49 7.6. Redes convolucionales: 51 7.7. Resultado final del proceso de detección de cultivos desde Gazebo: 54 8. Delimitación del camino de cultivo 56 8.2. Detección de límites de cultivo 58 8.3. Detección de centros de surco a partir de límites de cultivo 60 8.4. El problema de la perspectiva 61 8.4.1. Mapeo inverso de perspectiva 61 9. Detección de objetos 63 9.1. Detección de objetos con Red Convolucional 63 9.2. Detección de objetos con Modelo YOLO 64 9.2.1. Carga y etiqueta de las clases 65 9.2.2. Dataset de entrenamiento 66 9.2.3. Entrenamiento del algoritmo 68 9.2.4. Ejecución del algoritmo 68 9.2.5. Detección realizada por el algoritmo 70 10. Evasión de obstáculos 71 11. Integración del simulador con el proceso de detección de cultivos 77 11.2. Equivalencia Píxel – Distancia 78 12. Generación de mapa 81 13. Resultados 82 14. Conclusiones y trabajos futuros 87 15. Bibliografía 89 Given the importance that the agricultural sector represents for Colombia and the different advances and research that have been carried out with respect to precision agriculture, for this project it was decided to use technologies that would allow the exploration of a simulated crop, supported by an aerial vehicle. In this work, image processing techniques (morphological operations, color segmentation, average filter) and artificial intelligence algorithms (convolutional networks, YOLOv4) were used to identify crop lines and possible obstacles that can be found in a simulated crop. These images were obtained from a camera on a drone. As this process is carried out, a trajectory is generated which is followed by the drone to continue taking images and moving until it reaches the end of the crop. The location data of the furrows, trajectory and obstacles are saved to be processed and then generate a map. As a result, a validation accuracy of 0.87 was obtained in the detection of crop elements and an accuracy of 0.91 in the detection of obstacles. The trajectory generated through the identification of furrows and the use of the A* algorithm was optimal to avoid the obstacles present in the crop. Finally, the error graphs in the displacement of the aerial vehicle with respect to the desired positions tends to a value of 0. These results will allow providing crop information to the Ceres_Agrobot ground platform. Pregrado
- Published
- 2021
20. Lectura en tiempo real de MRZ (Zona de lectura mecánica) en dispositivos móviles
- Author
-
Castro Bleda, María José, Pieter Mostert, Hilbert, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Escrivá García, Jonás Baptiste, Castro Bleda, María José, Pieter Mostert, Hilbert, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Escrivá García, Jonás Baptiste
- Abstract
[ES] El procesamiento de imágenes se ha visto optimizado drásticamente en los últimos años, de forma que actualmente es posible realizar este procesamiento en tiempo real para, por ejemplo, leer el MRZ de un documento de identidad o un pasaporte. El MRZ, en el caso de los documentos de identidad españoles (DNI) se encuentra en la parte trasera del mismo y consta de 3 líneas de 30 caracteres cada una y contiene información importante del ciudadano en cuestión. En este trabajo se ha desarrollado una librería en C++ para la detección y lectura del MRZ. Adicionalmente, se ha diseñado e implementado una aplicación Android que usa la cámara del móvil para detectar el MRZ y extraer su información. El trabajo se ha completado con una aplicación web con la que mediante el uso de una web cam y de la misma librería se detecta el MRZ., [EN] Image processing has been so drastically improved over the last years that it has now become possible to do this processing in real time. This can be used, for example, to read the MRZ in an identification document or a passport. The MRZ, on Spanish identification documents (DIN) is on the back side and consists of 3 lines of 30 characters each and contain important information about the citizen. In this work, a library in C++ has been developed for the detection and reading of the MRZ. Additionally, an Android application has been designed and implemented, it uses the mobile camera to detect the MRZ and extract its information. The work has been completed with a web application that, using the webcam and the same library, detects the MRZ., [CA] El processament d’imatges s’ha vist optimitzat dràsticament els últims anys, de tal forma que actualment es possible realitzar aquest processament en temps real per a, per exemple, llegir el MRZ de un document de identitat o un passaport. El MRZ, en el cas dels documents de identitat espanyols (DNI) es troba en la part de darrere del mateix i consta de 3 línies de 30 caràcters cadascuna i contenen informació important sobre el ciutadà en qüestió. En aquest treball s’ha desenvolupat una llibreria en C++ per a la detecció i lectura del MRZ. Addicionalment, s’ha dissenyat i implementat una aplicació Android que utilitza la càmera del mòbil per a detectar el MRZ i extraure la seva informació. El treball s’ha completat amb una aplicació web amb la qual mitjançant el ús de una web cam i de la mateixa llibreria es detecta el MRZ.
- Published
- 2021
21. Micromobility safety applications using AI
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Sayrol Clols, Elisa, Morros Rubió, Josep Ramon, Prats Cristià, Jaume, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Sayrol Clols, Elisa, Morros Rubió, Josep Ramon, and Prats Cristià, Jaume
- Abstract
In recent years, population overcrowding in large cities has generated serious problems for urban transport, encouraging the use of new means of transportation such as micro-mobility vehicles. This thesis explores the possibilities of using computer vision techniques for the detection of damages in bike lanes, thus reinforcing the safety of this type of vehicle. A damage detector is developed using a convolutional neural network. The project also provides a database of damages present in the bike lanes of the city of Barcelona., En los últimos años, la masificación de la población en las grandes ciudades ha generado graves problemas para el transporte urbano, fomentando el uso de nuevos medios de transporte como es el caso de los vehículos de micromobilidad. Esta tesis explora las posibilidades del uso de técnicas de visión por ordenador para la detección de daños en los carriles bici, reforzando de esta forma la seguridad de este tipo de vehículos. Se desarrolla un detector de daños usando una red neuronal convolucional. El proyecto también aporta una base de datos de daños presentes en los carriles bici de la ciudad de Barcelona., En els darrers anys, la massificació de la població a les grans ciutats ha generat greus problemes per al transport urbà, encoratjant l'ús de nous mitjans de transport com és el cas dels vehicles de micromobilitat. Aquesta tesi explora les possibilitats de les tècniques de visió per ordinador per la detecció de danys als carrils bici, reforçant d'aquesta manera la seguretat per aquest tipus de vehicles. Es desenvolupa un detector de danys utilitzant una xarxa neuronal convolucional. El projecte també aporta una base de dades de danys presents en els carrils bici de la ciutat de Barcelona.
- Published
- 2021
22. Mètodes d'aprenentatge incremental
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Morros Rubió, Josep Ramon, Mateo Remacha, Àlex, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Morros Rubió, Josep Ramon, and Mateo Remacha, Àlex
- Abstract
This thesis presents the result of the research and development of technologies and algorithms based on incremental learning used in computer vision applications. The main objective is that the algorithms should be able to learn more concepts as time passes, adapt to possible changes in the stationarity of the data, manage and train the network once we have a new class at the entrance not seen before by the own network keeping the result of the old classes. To carry out the project, two databases were used that provide data sets separated by classes. The great challenge of the thesis is how to manage and preserve the knowledge of old classes without requiring a large amount of memory, which current algorithms need, while at the same time new classes are trained on the input., La tesis presenta el resultado de la investigación y desarrollo de tecnologías y algoritmos basados en el aprendizaje incremental utilizados en aplicaciones de visión por computadora. El principal objetivo es que los algoritmos deben ser capaces de aprender más conceptos a medida que pasa el tiempo, adaptarse a posibles cambios de estacionariedad de los datos, gestionar y entrenar la red una vez tenemos una nueva clase en la entrada no vista antes por la propia red manteniendo el resultado de las clases antiguas. Para llevar a cabo el proyecto, se ha utilizado dos bases de datos que proporcionan conjuntos de datos separados por clases. El gran reto de la tesis es como gestionar y preservar el conocimiento de clases antiguas sin requerir una gran cantidad de memoria, cosa que los algoritmos actuales necesitan, mientras a la vez clases nuevas en la entrada son entrenadas., La tesis presenta el resultat de la recerca i desenvolupament de tecnologies i algoritmes basats en l'aprenentatge incremental utilitzats en aplicacions de visió per computadora. El principal objectiu és que els algoritmes han de ser capaços d'aprendre més conceptes a mesura que passa el temps, d'adaptar-se a possibles canvis d'estacionarietat de les dades, gestionar i entrenar la xarxa un cop una nova classe és a l'entrada no vista abans per la pròpia xarxa. Per dur a terme el projecte, s'ha utilitzat dues bases de dades que proporcionen conjunts de dades separats per classes. El gran repte de la tesis és com gestionar i preservar el coneixement de classes antigues sense requerir una gran quantitat de memòria, cosa que els algoritmes actuals necessiten, mentre a la vegada classes noves a l?entrada són entrenades.
- Published
- 2021
23. Processing of satellite images
- Author
-
León Fernández, Leidy Tatiana and Garavito Rincón, Laura Natalia
- Subjects
Visor ,Coverage ,Cobertura ,Satellite image ,Image processing ,Viewer ,Teledetección ,Remote sensing ,Imagen satelital ,Procesamiento de imagen - Abstract
Remote sensing is a technique that allows to observe and obtain digital, geographical information of objects at a distance, this system has elements such as sensor, reception center and distribution channel that allow to measure and make a perception work from sensors or radars, making it essential for using with satellite images whose purpose is to obtain information of different earth surface coverage. Landsat has a series of eight satellites mainly characterized by the observation of high-resolution images of the earth’s surface, there is passive and active remote sensing, a passive remote sensing system collects electromagnetic energy reflected by an observed object and coming from the earth’s surface, Through this system the present article exposes the Landsat satellite image processing methodology through Erdas Imagine and ArcGIS software in order to use different tools to determine coverage, as well as compare satellite imagens and software that allow obtain better results in the images. La teledetección es una técnica que permite observar y obtener información digital, geográfica de objetos a distancia, este sistema posee elementos como sensor, centro de recepción y canal de distribución que permiten realizar labores de medición y percepción a partir de sensores o radares haciéndose indispensable el uso de imágenes satelitales cuyo fin es obtener información requerida de las diferentes coberturas en la superficie terrestre. Landsat cuenta con una serie de ocho satélites principalmente caracterizados por la observación de imágenes en alta resolución de la superficie terrestre, existe la teledetección pasiva y activa, un sistema de teledetección pasiva recoge energía electromagnética reflejada por un objeto observado y procedente de la superficie terrestre, a través de este sistema el presente artículo expone la metodología de procesamiento de imágenes satelitales Landsat mediante los softwares Erdas Imagine y ArcGIS con el fin de emplear el uso de las diferentes herramientas para determinar coberturas, así mismo comparar visores y software de imágenes satelitales que permitan obtener mejores resultados en las imágenes.
- Published
- 2021
24. Mètodes d'aprenentatge incremental
- Author
-
Mateo Remacha, Àlex, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Morros Rubió, Josep Ramon
- Subjects
Incremental Learning ,Imatges--Processament ,Informàtica::Intel·ligència artificial::Aprenentatge automàtic [Àrees temàtiques de la UPC] ,Image Processing ,Computer Vision ,Visió per ordinador ,Imatges -- Processament -- PFC ,Algorismes ,Procesamiento de imagen ,Visión por ordenador ,Aprendizaje incremental ,Aprenentatge automàtic -- PFC ,Aprendizaje automático ,Machine Learning ,Visió per ordinador -- PFC ,Aprenentatge automàtic ,Algorithms - Abstract
This thesis presents the result of the research and development of technologies and algorithms based on incremental learning used in computer vision applications. The main objective is that the algorithms should be able to learn more concepts as time passes, adapt to possible changes in the stationarity of the data, manage and train the network once we have a new class at the entrance not seen before by the own network keeping the result of the old classes. To carry out the project, two databases were used that provide data sets separated by classes. The great challenge of the thesis is how to manage and preserve the knowledge of old classes without requiring a large amount of memory, which current algorithms need, while at the same time new classes are trained on the input. La tesis presenta el resultado de la investigación y desarrollo de tecnologías y algoritmos basados en el aprendizaje incremental utilizados en aplicaciones de visión por computadora. El principal objetivo es que los algoritmos deben ser capaces de aprender más conceptos a medida que pasa el tiempo, adaptarse a posibles cambios de estacionariedad de los datos, gestionar y entrenar la red una vez tenemos una nueva clase en la entrada no vista antes por la propia red manteniendo el resultado de las clases antiguas. Para llevar a cabo el proyecto, se ha utilizado dos bases de datos que proporcionan conjuntos de datos separados por clases. El gran reto de la tesis es como gestionar y preservar el conocimiento de clases antiguas sin requerir una gran cantidad de memoria, cosa que los algoritmos actuales necesitan, mientras a la vez clases nuevas en la entrada son entrenadas. La tesis presenta el resultat de la recerca i desenvolupament de tecnologies i algoritmes basats en l'aprenentatge incremental utilitzats en aplicacions de visió per computadora. El principal objectiu és que els algoritmes han de ser capaços d'aprendre més conceptes a mesura que passa el temps, d'adaptar-se a possibles canvis d'estacionarietat de les dades, gestionar i entrenar la xarxa un cop una nova classe és a l'entrada no vista abans per la pròpia xarxa. Per dur a terme el projecte, s'ha utilitzat dues bases de dades que proporcionen conjunts de dades separats per classes. El gran repte de la tesis és com gestionar i preservar el coneixement de classes antigues sense requerir una gran quantitat de memòria, cosa que els algoritmes actuals necessiten, mentre a la vegada classes noves a l?entrada són entrenades.
- Published
- 2021
25. Lectura en tiempo real de MRZ (Zona de lectura mecánica) en dispositivos móviles
- Author
-
Escrivá García, Jonás Baptiste
- Subjects
Library ,Identity document ,Image processing ,Android ,Grado en Ingeniería Informática-Grau en Enginyeria Informàtica ,Web applications ,Aplicaciones web ,MRZ ,Procesamiento de imagen ,LENGUAJES Y SISTEMAS INFORMATICOS ,Librería ,Documento de identidad - Abstract
[ES] El procesamiento de imágenes se ha visto optimizado drásticamente en los últimos años, de forma que actualmente es posible realizar este procesamiento en tiempo real para, por ejemplo, leer el MRZ de un documento de identidad o un pasaporte. El MRZ, en el caso de los documentos de identidad españoles (DNI) se encuentra en la parte trasera del mismo y consta de 3 líneas de 30 caracteres cada una y contiene información importante del ciudadano en cuestión. En este trabajo se ha desarrollado una librería en C++ para la detección y lectura del MRZ. Adicionalmente, se ha diseñado e implementado una aplicación Android que usa la cámara del móvil para detectar el MRZ y extraer su información. El trabajo se ha completado con una aplicación web con la que mediante el uso de una web cam y de la misma librería se detecta el MRZ., [EN] Image processing has been so drastically improved over the last years that it has now become possible to do this processing in real time. This can be used, for example, to read the MRZ in an identification document or a passport. The MRZ, on Spanish identification documents (DIN) is on the back side and consists of 3 lines of 30 characters each and contain important information about the citizen. In this work, a library in C++ has been developed for the detection and reading of the MRZ. Additionally, an Android application has been designed and implemented, it uses the mobile camera to detect the MRZ and extract its information. The work has been completed with a web application that, using the webcam and the same library, detects the MRZ., [CA] El processament d’imatges s’ha vist optimitzat dràsticament els últims anys, de tal forma que actualment es possible realitzar aquest processament en temps real per a, per exemple, llegir el MRZ de un document de identitat o un passaport. El MRZ, en el cas dels documents de identitat espanyols (DNI) es troba en la part de darrere del mateix i consta de 3 línies de 30 caràcters cadascuna i contenen informació important sobre el ciutadà en qüestió. En aquest treball s’ha desenvolupat una llibreria en C++ per a la detecció i lectura del MRZ. Addicionalment, s’ha dissenyat i implementat una aplicació Android que utilitza la càmera del mòbil per a detectar el MRZ i extraure la seva informació. El treball s’ha completat amb una aplicació web amb la qual mitjançant el ús de una web cam i de la mateixa llibreria es detecta el MRZ.
- Published
- 2021
26. Models de Deep Learning per fer front a la COVID-19 a partir d’imatges mèdiques
- Author
-
Gómez Adrian, Jon Ander, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Martínez Bernia, Javier, Gómez Adrian, Jon Ander, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Martínez Bernia, Javier
- Abstract
[CA] En aquests moments estem vivint una pandèmia mundial causada pel SARSCoV-2, un virus que produeix una enfermetat infecciosa coneguda com COVID19 que provoca, entre altres, malalties respiratòries, com pneumònia en casos greus. Aquest projecte es centra en l’anàlisi d’imatge mèdica per a la detecció de pneumònia a partir de radiografies pulmonars per tal d’ajudar a la lluita contra la pandèmia. Durant el projecte s’utilitzaran tècniques d’aprenentatge profund per a construir diversos classificadors amb l’ús de xarxes neuronals convolucionals que siguen capaços de detectar la infecció. La finalitat és que aquests classificadors puguen ajudar al personal mèdic a la criva de pacients que presenten simptomatologies durant la pandèmia. S’utilitzarà un conjunt d’imatges de radiografies pulmonars proporcionat pel Banc digital d’Imatge Mèdica de la Comunitat Valenciana -BIMCV-, les quals entrenaran els models construïts., [ES] En estos momentos estamos viviendo una pandemia mundial causada por el SARS-CoV-2, un virus que produce una enfermedad infecciosa que se conoce como COVID-19, la cual provoca, entre otras, enfermedades respiratorias, como neumonía en casos graves. Este proyecto se centra en el análisis de imagen médica para la detección de neumonía a partir de radiografías pulmonares con tal de ayudar en la lucha contra la pandemia. Durante el proyecto se usarán técnicas de aprendizaje profundo para construir diversos clasificadores utilizando redes neuronales convolucionales los cuales sean capaces de detectar la infección. La finalidad es que estos clasificadores puedan ayudar al personal médico en el triaje de pacientes que presenten sintomatologías durante la pandemia. Se utilizará un conjunto de imágenes de radiografías pulmonares proporcionado por el Banco digital de Imagen Médica de la Comunidad Valenciana -BIMCV-, las cuales entrenarán los modelos construidos., [EN] Nowadays we are experiencing a worldwide pandemic caused by the SARSCoV-2, a virus that produces an infectious disease known as COVID-19, which causes, among others, respiratory diseases, such as pneumonia in severe cases. This project is focused on medical image analysis for the detection of pneumonia from lung X-ray images in order to fight against the pandemic. During the project, deep learning techniques will be used to build various classifiers that can detect the infection. The purpose is that these classifiers will be able to help medical personnel at the screening of patients presenting symptomatologies during the pandemic. A set of lung X-ray images provided by the Medical Imaging Databank of the Valencia Region -BIMCV- will be used to train the built models.
- Published
- 2020
27. Diseño e implementación de un prototipo de dispositivo ADAS para detección y alerta de microsueño, en conductores de vehículos terrestres de trasporte de carga y de pasajeros en el contexto Colombiano
- Author
-
Navarro Beltrán, Juan Carlos / Director, Calderón Montealegre, Alfredojosé, Balcero Posada, Pablo Emilio, Navarro Beltrán, Juan Carlos / Director, Calderón Montealegre, Alfredojosé, and Balcero Posada, Pablo Emilio
- Abstract
En este documento se presenta el desarrollo del proyecto de grado que tiene como objetivo el diseño e implementación de un prototipo de dispositivo ADAS para la detección y alerta de microsueño en conductores de carga pesada o pasajeros en el contexto colombiano. El desarrollo de este proyecto se dividió en dos fases, dentro las cuales la primera abarca el enfoque de ingeniería de sistemas y la segunda abarca el enfoque de ingeniera de telecomunicaciones. Se utilizaron herramientas de procesamiento de imagen para poder evaluar la imagen del conductor, así mismo se hizo uso de la red móvil celular para enviar la alerta a la empresa. Los resultados obtenidos nos indican que el prototipo de dispositivo es funcional, por lo tanto, se concluye que es posible determinar de manera fiable si un conductor tiene un episodio de microsueño a partir del procesamiento de imagen analizando el estado de los ojos, y que se puede emitir una alarma sonora y una alerta visual cuando esto ocurre, y si el vehículo opera para una empresa, enviar una alerta vía SMS a esta.
- Published
- 2020
28. Development and integration of a real-time human pose estimation and activity classification system
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Hernan Galobart, Oriol, Nogueiras Rodríguez, Albino, Fabré Solà, Roger, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Hernan Galobart, Oriol, Nogueiras Rodríguez, Albino, and Fabré Solà, Roger
- Abstract
La estimación de la postura humana y el reconocimiento de la actividad es un componente crucial en el campo de la visión por ordenador. De este modo, se permite a las máquinas comprender el comportamiento de las personas en imágenes y vídeos. Debido a los crecientes avances en el procesado de imágenes y en la visión por ordenador, las técnicas para el reconocimiento de la actividad humana se han vuelto cada vez más accesibles. En esta tesis, se ha implementado un sistema de reconocimiento de actividad, en tiempo real y para múltiples personas, utilizando los puntos anatómicos claves de un esqueleto humano. Estos puntos clave se extraen de imágenes RGB utilizando la biblioteca de código abierto, OpenPose. Luego, se utiliza una red neuronal artificial para clasificar las actividades basándose con la posición de estos puntos clave. Para hacer que el sistema sea capaz de detectar varias personas y al mismo tiempo, se trata a cada persona de manera independiente y se le asigna una identificación única o ID a cada una. El método propuesto muestra un rendimiento prometedor, alcanzando más del noventa por ciento de precisión. Este sistema de reconocimiento de actividad humana puede contribuir a destacados campos de investigación como el procesamiento de imágenes y el reconocimiento de patrones con variedad de aplicaciones prácticas., L’estimació de la postura corporal humana i el reconeixement d’activitat és un component molt rellevant en el camp de la visió per ordinador, permetent a les màquines entendre el comportament de les persones en imatges i vídeos. A causa dels avenços en processament d’imatge i visió per ordinador, les tècniques de reconeixement d’activitats humanes han esdevingut cada vegada més accessibles. En aquesta tesi, s’ha implementat un sistema de reconeixement d’activitat en temps real i multi persona, utilitzant els punts anatòmics clau d’un esquelet humà. Aquests, s’extreuen a partir d’imatges RGB mitjançant la biblioteca de codi obert, OpenPose. A continuació, s’utilitza una xarxa neuronal artificial per classificar-ne l’acció a partir de les posicions de cada punt clau. Perquè el sistema sigui capaç de suportar múltiples deteccions al mateix temps, i tracti a cada una de manera independent, se li assigna un identificador únic o ID a cada detecció. El mètode proposat mostra un rendiment prometedor, assolint una precisió global de prop del noranta per cent. Aquest sistema de reconeixement d’activitats humanes pot contribuir a camps d’investigació destacats com el processament d’imatges i el reconeixement de patrons amb aplicacions pràctiques. ii, Human pose estimation and activity recognition is a crucial component in computer vision, enabling machines to understand peoples behavior in images and videos. Due to the rising advancements in computer vision and image processing, techniques for human activity recognition (HAR) have become increasingly accessible. In this thesis, a real-time multi-human activity recognition system has been implemented using the anatomical key points of a human being. These key points are extracted from RGB images using the open-source library, OpenPose. Then, an Artificial Neural Network is used to recognize the activities related to these key points. To make the system multi-person and simultaneously treat each person independently, a unique ID is assigned. The proposed method shows promising performance, reaching over a ninety percent overall accuracy. This human activity recognition system can contribute to prominent research fields like image processing and pattern recognition with practical applications
- Published
- 2020
29. Analysis and test of image acquisition methods for cinematography
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Casas Pla, Josep Ramon, López Salazar, Juan José, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Casas Pla, Josep Ramon, and López Salazar, Juan José
- Abstract
This project is a dive into the methods and technologies behind the state-of-the-art motion picture cameras, followed by an analysis of the attributes that contribute to the desired photographic “look”. The first part of the project consists of a thorough theoretical research, which demonstrates the significant influence of the image processing pipeline on the attributes that mold the photographic look, as well as the importance of attribute manipulation when comparing camera systems. The practical part of the project further explores the idea of camera analysis by equalization of manipulable attributes. Specifically tone and colour manipulation, with the use of three 1D look-up tables and tetrahedral colour mapping correspondingly, of footage shot on an Arri Alexa Mini and a Red Weapon Helium. By successfully achieving this equalization we can reach two main conclusions. Firstly, we confirm that a camera's "colour science" is clearly a manipulable attribute. And secondly, we can use the equalization of manipulable attributes to analyze other attributes, such as noise, with less bias. 1, Aquest projecte és una immersió en els mètodes i les tecnologies capdavanteres d'adquisició d'imatge en càmeres de cinema, seguit d'una anàlisi dels factors que influeixen en el “look” fotogràfic desitjat per l'autor. Un estudi teòric exhaustiu ha demostrat la importància del processament del senyal en comparar sistemes de càmeres i la seva influència en els atributs que modelen el “look” final de la imatge. La part pràctica explora la idea de l'anàlisi de la càmera mitjançant l'equalització d'atributs manipulables, específicament la manipulació de tons i colors amb l'ús de tres “look-up tables” unidimensionals i “mapping” de colors a través de geometria tetraèdrica, sobre un dataset d'imatges preses amb una Arri Alexa Mini i una Red Weapon Helium. En aconseguir amb èxit aquesta equalització podem arribar a dues conclusions principals: En primer lloc, confirmem que la "ciència del color" d'una càmera és clarament un atribut manipulable, i en segon lloc, podem usar l'equalització d'atributs manipulables per a analitzar altres atributs, com el soroll, des d'un punt de vista més objectiu.
- Published
- 2020
30. Efecto de la coplanaridad entre cámara y hoja para la determinación de área foliar en Eichhornia crassipes con imágenes digitales
- Author
-
Gómez Rodríguez, Alida Marcela, Garzón-Salcedo, Luis Carlos, Espinoza Manrique, Wilfred Edilberto, Cárdenas Castillo, Sergio Daniel, Guzmán Sanabria, Diomedes, and Bermúdez Duarte, David Felipe
- Subjects
Metodologías ,Exactitud ,Image processing ,Procesamiento de imágen ,Processamento de imagem ,Methodologies ,Precision ,Precisão ,Accuracy ,Software ,Exatidão ,Metodologias ,Precisión - Abstract
The non-destructive methodologies used to determine leaf area through photographic captures and subsequent processing have had an important reception in various disciplines. However, there are few studies that validate the effect of the coplanarity or non-coplanarity between the camera planes and the leaves in terms of precision and accuracy. In this study, the precision of the leaf area values obtained in the Eichhornia crassipes plant was evaluated, using two non-destructive methodologies with image processing in Image J software. Subsequently, the accuracy is evaluated in the non-destructive methodology showing less variability in the results. Method 1 does not present a rigorous control between planes, while methodology 2 uses a device to guarantee coplanarity. As references, an image processing system and printed elliptical figures of known area built with AutoCAD software were used. The results show with a confidence level of 95% the same level of precision between the reference image processing system and methodology 2, which turned out to be the most accurate. Regarding the accuracy, evaluated through the confidence limits for the slope and intercept of curve calibration parameters, a statistically similar behavior was obtained between method 2 and the AutoCAD software, and the same differences between methodology/referents and referent/referrer. Las metodologías no destructivas empleadas para determinar área foliar mediante capturas fotográficas y posterior procesamiento han tenido una importante acogida en diversas disciplinas. Sin embargo, son escasos los estudios que validan en términos de precisión y exactitud el efecto de la coplanaridad o de la no-coplanaridad entre los planos de la cámara y la hoja. En este estudio se evaluó la precisión de los valores de área foliar obtenidos en la planta Eichhornia crassipes, utilizando dos metodologías no destructivas con procesamiento de imagen en el software Image J. Posteriormentemse se evaluó la exactitud en la metodología no destructiva que presentó menor variabilidad de los resultados. La metodología 1 no presenta un control riguroso entre los planos, mientras que la metodología 2 emplea un dispositivo para garantizar coplanaridad. Como referentes se emplearon un sistema de procesamiento de imagen y figuras elípticas impresas de área conocida construidas con el software AutoCAD. Los resultados muestran con un nivel de confianza del 95% el mismo nivel de precisión entre el referente sistema de procesamiento de imagen y la metodología 2, que a su vez resultó ser la más precisa. En relación a la exactitud, evaluada a través de los límites de confianza para los parámetros pendiente e intercepto de curvas de calibración, se obtuvo un comportamiento estadísticamente similar entre la metodología 2 y el software AutoCAD, y las mismas diferencias entre metodología/referentes y referente/referente. As metodologias não destrutivas utilizadas para determinar área foliar mediante capturas fotográficas e posterior processamento vêm tendo importante recebimento em diversas disciplinas. Contudo, são escassos os estudos que validam, em termos de precisão e exatidão, o efeito da coplanaridade ou da não coplanaridade entre os planos da câmera e da folha. Neste estudo, foi avaliada a precisão dos valores de área foliar obtidos na planta Eichhornia crassipes, utilizando duas metodologias não destrutivas com processamento de imagem no software Image J. Em seguida, foi avaliada a exatidão na metodologia não destrutiva que apresentou menor variabilidade dos resultados. A metodologia 1 não apresenta um controle rigoroso entre os planos, enquanto a metodologia 2 utiliza um dispositivo para garantir coplanaridade. Como referentes, foram utilizados um sistema de processamento de imagem e figuras elípticas impressas de área conhecida construídas com o software AutoCAD. Os resultados mostram um nível de confiança de 95 %, o mesmo nível de precisão entre o referente sistema de processamento de imagem e a metodologia 2, que, por sua vez, resultou ser a mais precisa. Quanto à exatidão, avaliada pelos limites de confiança para os parâmetros pendente e intercepto de curvas de calibração, foi obtido comportamento estatisticamente similar entre a metodologia 2 e o software AutoCAD, e as mesmas diferenças entre metodologia e referentes e referente e referente.
- Published
- 2021
31. Effect of morphological filters on the moving object detection process
- Author
-
Castro Casadiego, Sergio, Sanchez Mojica, Karla Yohana, Puerto, Karla, Niño , Carlos, Medina Delgado, Byron, and Guevara-Ibarra, Dinael
- Subjects
filtros morfológicos ,detección de objetos ,procesamiento de imagen ,object detection ,Sustracción de fondo ,morphological filters ,background subtraction ,image processing - Abstract
En los procesos de sustracción de fondo aplicado a la detección de objetos en movimiento, una de las etapas de mayor relevancia es la del filtrado por morfología, en donde se simplifica la imagen y se conservan la mayor parte de las características de forma de los objetos. Por ello, se realiza una comparativa entre las operaciones de dilatación, erosión, apertura, cierre y gradiente en imágenes de video con fondo estático, donde circulan personas en ambientes no controlados, con el objetivo de determinar su comportamiento en la detección y conteo de personas. El procesamiento de imagen se realiza en lenguaje Python y se utiliza el paquete especializado para visión por computadora OpenCV. Además, mediante Tkinter se desarrolló una interfaz gráfica de usuario con la que se ingresan los valores del tamaño y la forma del elemento estructural para el procesamiento. Al aplicar el filtrado morfológico por dilatación se obtuvo un acierto en las detecciones de 82.28 %, con la erosión el acierto fue de 81.86 %, mientras que, con las operaciones de apertura, cierre y gradiente el acierto fue de 83.69 %, 93.07 % y 87.69 % respectivamente. In the processes of background subtraction applied to the detection of moving objects, one of the most relevant stages is the filtering by morphology, where the image is simplified and most of the shape characteristics of the objects are preserved. Therefore, a comparison is made between the operations of dilation, erosion, opening, closing and gradient in video images with static background, where people circulate in uncontrolled environments, to determine their behavior in the detection and counting of people. Image processing is performed in Python language and the specialized computer vision package OpenCV is used. In addition, a graphical user interface was developed using Tkinter to enter the values of the size and shape of the structural element for processing. When applying the morphological filtering by dilatation, a success in the detections of 82.28 %, with erosion the accuracy was 81.86 %, while, with the opening, closing and gradient operations the accuracy was 83.69 %, 93.07 % and 87.69 % respectively.
- Published
- 2021
32. Nuevos métodos para la combinación de características en procesamiento de imágenes
- Author
-
Juan Ignacio Forcén, Pagola Barrio, Miguel, Barrenechea Tartas, Edurne, Universidad Pública de Navarra. Departamento de Estadística, Informática y Matemáticas, and Nafarroako Unibertsitate Publikoa. Estatistika, Informatika eta Matematika Saila
- Subjects
Aprendizaje profundo ,Recuperación de imágenes ,Visión por computador ,Procesamiento de imagen - Abstract
En esta memoria estudiamos diferentes problemas abiertos entorno a la agregación de información y presentamos el estudio de nuevas técnicas de agregación de características de imágenes para mejorar el rendimiento en los problemas de clasificación y recuperación de imágenes, realizando propuestas para algoritmos de visión por computador tradicional y para modelos de Deep Learning. Concretamente, hemos propuesto un método para agregar información en problemas de clasificación multi-clase a través de ensembles ponderados. También presentamos una nueva función de pooling capaz de auto aprenderse para redes neuronales convolucionales. Centrándonos en el problema de recuperación de imágenes proponemos un esquema de agregación de características donde damos mayor importancia a los objetos relevantes de la imagen y finalmente introducimos una nueva representación de Co-Ocurrencias auto aprendible para redes neuronales convolucionales capaz de capturar la correlación espacial entre diferentes características. La memoria está dividida en dos partes: Parte I. Dedicada al planteamiento del problema, la discusión de los métodos propuestos, los resultados y las conclusiones obtenidas. Parte II. Contiene las publicaciones asociadas al estudio realizado. Programa de Doctorado en Ciencias y Tecnologías Industriales (RD 99/2011) Industria Zientzietako eta Teknologietako Doktoretza Programa (ED 99/2011)
- Published
- 2021
33. Driver distraction detection using machine vision techniques.
- Author
-
Jiménez Moreno, Robinson, Avilés Sánchez, Oscar, and Amaya Hurtado, Darío
- Subjects
- *
DISTRACTED driving , *DISTRACTION , *COMPUTER vision , *IMAGE processing , *ARTIFICIAL neural networks , *AUTOMOBILE drivers - Abstract
This article presents a system for detecting states of distraction in drivers during daylight hours using machine vision techniques, which is based on the image segmentation of the eyes and mouth of a person, with a front-face-view camera. From said segmentation states of motion of the mouth and head are established, thus allowing to infer the corresponding state of distraction. Images are extracted from short videos with a resolution of 640x480 pixels and image processing techniques such as color space transformation and histogram analysis are applied. A decision concerning the state of the driver is the result from a multilayer perceptron-type neural network with all extracted features as inputs. Achieved performance is 90% for a controlled environment screening test and 86% in real environment, with an average response time of 30 ms. [ABSTRACT FROM AUTHOR]
- Published
- 2014
34. COMBINACIÓN DE TÉCNICAS DE PROCESAMIENTO DIGITAL DE IMÁGENES Y GEOMETRÍA ANALÍTICA PARA LA DETECCIÓN DE LESIONES PATOLÓGICAS EN IMÁGENES DE MAMOGRAFÍA.
- Author
-
Costa Alonso, Danays Bárbara, Díaz Sotolongo, Alejandro, Martín Alfonso, Juan Antonio, and Pérez Pérez, Noel
- Abstract
Copyright of 3C Tecnologia is the property of Area de Innovacion y Desarrollo, SL and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2014
35. Migración de un centro de datos en local (on-premise) a la nube. Minijuegos utilizando procesamiento de imagen en android
- Author
-
Varshava Aroca, Taras, Ribelles Miguel, José, Universitat Jaume I. Departament de Llenguatges i Sistemes Informàtics, and Martí Pascual, Rodrigo
- Subjects
Grau en Enginyeria Informàtica ,Bachelor's Degree in Computer Engineering ,multiplayer minigames ,Amazon Web Services ,procesamiento de imagen ,minijuegos multijugador ,Android Studio ,Grado en Ingeniería Informática ,image processing - Abstract
Treball Final de Grau en Enginyeria Informàtica. Codi: EI1054. Curs acadèmic: 2019/2020 Memoria desarrollada para la asignatura EI1054 – Prácticas externas y Trabajo Final de Grado de Ingeniería Informática en la Universidad Jaume I de Castellón. Esta memoria incluye por una parte la estancia en prácticas realizada en la empresa RecordGo Alquiler Vacacional (Castellón) y por otra parte, la realización de un TAD dirigido por el tutor de prácticas externas José Ribelles Miguel. Por una parte, el objetivo del proyecto realizado durante la estancia de prácticas, es poder prescindir del centro de datos local de la oficina central de RecordGo y trasladar todos los servicios operativos a la nube, de forma que el core del negocio de la empresa esté gestionado desde esta. Este proyecto consiste en llevar a cabo una reestructuración de la infraestructura de la empresa y migrar los servicios de forma que éstos puedan operar de la forma más óptima y eficiente posible en un sistema cloud, más concretamente Amazon Web Services. De esta manera la empresa podría disminuir su tiempo de dedicación a controlar el funcionamiento del sistema de red, y además podría integrar nuevos servicios y características de negocio más fácilmente. Por otra parte, el objetivo del Trabajo Académicamente Dirigido consiste en evaluar si el uso de las técnicas actuales de procesamiento de imágenes puede ser de interés en el campo de los videojuegos. Para ello se ha desarrollado una aplicación en Android Studio con dos juegos, cuyos principales atractivos son la posibilidad de partidas multijugador y el procesamiento de imágenes en tiempo real.
- Published
- 2020
36. Control de desplazamiento de móvil robótico mediante movimientos de cabeza utilizando visión de máquina.
- Author
-
Jiménez, R. and Avilés, O. F.
- Abstract
En este artículo se presenta el control de movimiento de un móvil robótico de cuatro ruedas con control de dirección, el cual es operado mediante comandos basados en movimientos de cabeza para su desplazamiento en avance, reversa, izquierda y derecha. Mediante técnicas de procesamiento de imagen se genera un vector de desplazamiento de cabeza, cuya dirección es utilizada para determinar la orientación de desplazamiento del móvil. Los movimientos de cabeza se basan en la detección de los ojos mediante el algoritmo de Viola-Jones, de este se determina una posición de referencia a fin de establecer las coordenadas de origen del vector, de forma tal que el desplazamiento de ojos desde este punto, genera la magnitud que determina la dirección de desplazamiento del móvil, el telecontrol se realiza mediante protocolo XBEE del computador a la tarjeta microcontrolada que opera el vehículo, la precisión obtenida bajo un ambiente de luz semi controlado es de 99.8%. In this article the motion control of a robotic mobile-wheel steering control, which is operated by head movements based for movement forward, reverse, left and right commands is presented. By image processing techniques displacement vector head, whose address is used to determine the direction of movement of the mobile is generated. Head movement based on the detection of the eye by the algorithm of Viola-Jones of this a reference position to establish the coordinates of the origin of the vector so determined such that the movement of eyes from this point generates the magnitude which determines the direction of movement of the mobile, remote protocol is performed by the computer XBEE microcontrolled card to operating the vehicle, the accuracy obtained under semi controlled lighting environment is 99.8%. [ABSTRACT FROM AUTHOR]
- Published
- 2014
37. Models de Deep Learning per fer front a la COVID-19 a partir d’imatges mèdiques
- Author
-
Martínez Bernia, Javier
- Subjects
SARS-CoV-2 ,Aprendizaje profundo ,Grado en Ingeniería Informática-Grau en Enginyeria Informàtica ,Xarxes neuronals ,COVID-19 ,Imatge mèdica ,Deep learning ,Redes neuronales ,Procesamiento de imagen ,Medical images ,Processament d’imatge ,Image processing ,Aprenentatge automàtic ,Machine learning ,Imagen médica ,LENGUAJES Y SISTEMAS INFORMATICOS ,Neural networks ,Aprenentatge profund - Abstract
[CA] En aquests moments estem vivint una pandèmia mundial causada pel SARSCoV-2, un virus que produeix una enfermetat infecciosa coneguda com COVID19 que provoca, entre altres, malalties respiratòries, com pneumònia en casos greus. Aquest projecte es centra en l’anàlisi d’imatge mèdica per a la detecció de pneumònia a partir de radiografies pulmonars per tal d’ajudar a la lluita contra la pandèmia. Durant el projecte s’utilitzaran tècniques d’aprenentatge profund per a construir diversos classificadors amb l’ús de xarxes neuronals convolucionals que siguen capaços de detectar la infecció. La finalitat és que aquests classificadors puguen ajudar al personal mèdic a la criva de pacients que presenten simptomatologies durant la pandèmia. S’utilitzarà un conjunt d’imatges de radiografies pulmonars proporcionat pel Banc digital d’Imatge Mèdica de la Comunitat Valenciana -BIMCV-, les quals entrenaran els models construïts., [ES] En estos momentos estamos viviendo una pandemia mundial causada por el SARS-CoV-2, un virus que produce una enfermedad infecciosa que se conoce como COVID-19, la cual provoca, entre otras, enfermedades respiratorias, como neumonía en casos graves. Este proyecto se centra en el análisis de imagen médica para la detección de neumonía a partir de radiografías pulmonares con tal de ayudar en la lucha contra la pandemia. Durante el proyecto se usarán técnicas de aprendizaje profundo para construir diversos clasificadores utilizando redes neuronales convolucionales los cuales sean capaces de detectar la infección. La finalidad es que estos clasificadores puedan ayudar al personal médico en el triaje de pacientes que presenten sintomatologías durante la pandemia. Se utilizará un conjunto de imágenes de radiografías pulmonares proporcionado por el Banco digital de Imagen Médica de la Comunidad Valenciana -BIMCV-, las cuales entrenarán los modelos construidos., [EN] Nowadays we are experiencing a worldwide pandemic caused by the SARSCoV-2, a virus that produces an infectious disease known as COVID-19, which causes, among others, respiratory diseases, such as pneumonia in severe cases. This project is focused on medical image analysis for the detection of pneumonia from lung X-ray images in order to fight against the pandemic. During the project, deep learning techniques will be used to build various classifiers that can detect the infection. The purpose is that these classifiers will be able to help medical personnel at the screening of patients presenting symptomatologies during the pandemic. A set of lung X-ray images provided by the Medical Imaging Databank of the Valencia Region -BIMCV- will be used to train the built models., Aquest projecte s’ha desenvolupat en col·laboració amb l’equip del projecte DeepHealth1 del centre d’investigació Pattern Recognition and Human Language Technology, el qual ha intentat aportar models de Deep Learning per al problema plantejat pel Banc digital d’Imatge Mèdica de la Comunitat Valenciana, tal com estaven fent altres equips.
- Published
- 2020
38. Desarrollo e integración de un sistema de estimación de postura y clasificación de actividad en tiempo real para múltiples personas
- Author
-
Fabré Solà, Roger, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Hernan Galobart, Oriol, and Nogueiras Rodríguez, Albino
- Subjects
Neural networks (Computer science) ,Biometria ,Biometry ,Image processing ,Biometrics ,Neural Networks ,Procesamiento de imágen ,Biometría ,Xarxes neuronals (Informàtica) ,Redes neuronales ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] ,Imatges -- Processament - Abstract
La estimación de la postura humana y el reconocimiento de la actividad es un componente crucial en el campo de la visión por ordenador. De este modo, se permite a las máquinas comprender el comportamiento de las personas en imágenes y vídeos. Debido a los crecientes avances en el procesado de imágenes y en la visión por ordenador, las técnicas para el reconocimiento de la actividad humana se han vuelto cada vez más accesibles. En esta tesis, se ha implementado un sistema de reconocimiento de actividad, en tiempo real y para múltiples personas, utilizando los puntos anatómicos claves de un esqueleto humano. Estos puntos clave se extraen de imágenes RGB utilizando la biblioteca de código abierto, OpenPose. Luego, se utiliza una red neuronal artificial para clasificar las actividades basándose con la posición de estos puntos clave. Para hacer que el sistema sea capaz de detectar varias personas y al mismo tiempo, se trata a cada persona de manera independiente y se le asigna una identificación única o ID a cada una. El método propuesto muestra un rendimiento prometedor, alcanzando más del noventa por ciento de precisión. Este sistema de reconocimiento de actividad humana puede contribuir a destacados campos de investigación como el procesamiento de imágenes y el reconocimiento de patrones con variedad de aplicaciones prácticas. L’estimació de la postura corporal humana i el reconeixement d’activitat és un component molt rellevant en el camp de la visió per ordinador, permetent a les màquines entendre el comportament de les persones en imatges i vídeos. A causa dels avenços en processament d’imatge i visió per ordinador, les tècniques de reconeixement d’activitats humanes han esdevingut cada vegada més accessibles. En aquesta tesi, s’ha implementat un sistema de reconeixement d’activitat en temps real i multi persona, utilitzant els punts anatòmics clau d’un esquelet humà. Aquests, s’extreuen a partir d’imatges RGB mitjançant la biblioteca de codi obert, OpenPose. A continuació, s’utilitza una xarxa neuronal artificial per classificar-ne l’acció a partir de les posicions de cada punt clau. Perquè el sistema sigui capaç de suportar múltiples deteccions al mateix temps, i tracti a cada una de manera independent, se li assigna un identificador únic o ID a cada detecció. El mètode proposat mostra un rendiment prometedor, assolint una precisió global de prop del noranta per cent. Aquest sistema de reconeixement d’activitats humanes pot contribuir a camps d’investigació destacats com el processament d’imatges i el reconeixement de patrons amb aplicacions pràctiques. ii Human pose estimation and activity recognition is a crucial component in computer vision, enabling machines to understand peoples behavior in images and videos. Due to the rising advancements in computer vision and image processing, techniques for human activity recognition (HAR) have become increasingly accessible. In this thesis, a real-time multi-human activity recognition system has been implemented using the anatomical key points of a human being. These key points are extracted from RGB images using the open-source library, OpenPose. Then, an Artificial Neural Network is used to recognize the activities related to these key points. To make the system multi-person and simultaneously treat each person independently, a unique ID is assigned. The proposed method shows promising performance, reaching over a ninety percent overall accuracy. This human activity recognition system can contribute to prominent research fields like image processing and pattern recognition with practical applications
- Published
- 2020
39. Analysis and test of image acquisition methods for cinematography
- Author
-
López Salazar, Juan José, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Casas Pla, Josep Ramon
- Subjects
Imatges digitals ,Colorimetria ,Image processing ,cinema camera systems ,Comunicacions analògiques ,procesamiento de imagen ,Colorimetry ,cinematography ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] ,Imatges -- Processament ,colimetría ,Digital images - Abstract
This project is a dive into the methods and technologies behind the state-of-the-art motion picture cameras, followed by an analysis of the attributes that contribute to the desired photographic “look”. The first part of the project consists of a thorough theoretical research, which demonstrates the significant influence of the image processing pipeline on the attributes that mold the photographic look, as well as the importance of attribute manipulation when comparing camera systems. The practical part of the project further explores the idea of camera analysis by equalization of manipulable attributes. Specifically tone and colour manipulation, with the use of three 1D look-up tables and tetrahedral colour mapping correspondingly, of footage shot on an Arri Alexa Mini and a Red Weapon Helium. By successfully achieving this equalization we can reach two main conclusions. Firstly, we confirm that a camera's "colour science" is clearly a manipulable attribute. And secondly, we can use the equalization of manipulable attributes to analyze other attributes, such as noise, with less bias. 1 Aquest projecte és una immersió en els mètodes i les tecnologies capdavanteres d'adquisició d'imatge en càmeres de cinema, seguit d'una anàlisi dels factors que influeixen en el “look” fotogràfic desitjat per l'autor. Un estudi teòric exhaustiu ha demostrat la importància del processament del senyal en comparar sistemes de càmeres i la seva influència en els atributs que modelen el “look” final de la imatge. La part pràctica explora la idea de l'anàlisi de la càmera mitjançant l'equalització d'atributs manipulables, específicament la manipulació de tons i colors amb l'ús de tres “look-up tables” unidimensionals i “mapping” de colors a través de geometria tetraèdrica, sobre un dataset d'imatges preses amb una Arri Alexa Mini i una Red Weapon Helium. En aconseguir amb èxit aquesta equalització podem arribar a dues conclusions principals: En primer lloc, confirmem que la "ciència del color" d'una càmera és clarament un atribut manipulable, i en segon lloc, podem usar l'equalització d'atributs manipulables per a analitzar altres atributs, com el soroll, des d'un punt de vista més objectiu.
- Published
- 2020
40. Development of a mosaic effect for teaching in the course of parallel architectures
- Author
-
Matías García Rivera, Miguel Díaz-Cacho Medina, and Alejandro González García
- Subjects
Procesamiento vectorial ,Parallel computing ,Computación paralela ,Parallelism (rhetoric) ,Image processing ,Computer science ,Educación ,Vector processing ,Context (language use) ,Procesamiento de imagen ,Humanities ,Lecturing - Abstract
[Resumen] En este artículo presentamos el desarrollo de un efecto artístico de mosaico entre dos imágenes usado en la enseñanza de técnicas de paralelismo y visión por computador. La implementación del efecto con el uso de paralelismo a nivel de datos e instrucción, el lenguaje de programación C y la biblioteca OpenCV permite que el alumnado descubra las ventajas y limitaciones de este paradigma en el contexto de una aplicación de procesado de imágenes, que consideramos atractiva para el alumnado, brindándole conocimientos prácticos en ambos campos y contribuyendo a afianzar los teóricos. [Abstract] In this article we present the development of an artistic mosaic effect between two images used in the teaching of parallelism and computer vision techniques. The implementation of the effect with the use of parallelism, the programming language C and the OpenCV library allows students to discover the advantages and limitations of this paradigm in the context of an image processing application, which we consider attractive for students. , providing practical knowledge and contributing to improve the theorists. Comisión Europea; 586035-EPP-1-2017-1-DZ-EPPKA2-CBHE-JP
- Published
- 2020
- Full Text
- View/download PDF
41. Evaluación de procesos de reconocimiento óptico de caracteres y detección de tablas para la clasificación automática de documentos y su integración en un gestor documental
- Author
-
Ayllón Lafuente, Leyre, Escuela Técnica Superior de Ingeniería Industrial, Informática y de Telecomunicación, Industria, Informatika eta Telekomunikazio Ingeniaritzako Goi Mailako Eskola Teknikoa, Galar Idoate, Mikel, and Sesma Sara, Mikel
- Subjects
Informática ,OCR ,Detección de tablas ,Redes neuronales ,Clasificación de documentos ,Procesamiento de imagen - Abstract
En este trabajo de fin de grado pretendemos desarrollar un algoritmo de detección de tablas en imágenes de documentos, complementando las funcionalidades de una librería de código abierto de reconocimiento de texto en imágenes, con el fin de realizar una clasificación automática de los documentos. Para facilitar las tareas de detección de tablas y reconocimiento de texto aplicaremos una fase previa de preprocesamiento de imágenes. El algoritmo desarrollado será aplicado a documentos escaneados para obtener características (palabras, número de páginas, número de tablas y estructura de las mismas…) que permitan crear un modelo de clasificación de documentos no estructurados mediante redes neuronales. La red neuronal se entrenará con documentos previamente etiquetados y permitirá la predicción de nuevos documentos en el momento de la digitalización de estos. El algoritmo desarrollado completo de preprocesamiento, detección de tablas y de texto y clasificación de imágenes escaneadas se integrará en una plataforma de gestión documental. Graduado o Graduada en Ingeniería Informática por la Universidad Pública de Navarra Informatika Ingeniaritzako Graduatua Nafarroako Unibertsitate Publikoan
- Published
- 2020
42. Modelos basados en Deep Learning para hacer frente al COVID-19 a partir de imágenes médicas
- Author
-
Martínez Bernia, Javier
- Subjects
SARS-CoV-2 ,Aprendizaje profundo ,Grado en Ingeniería Informática-Grau en Enginyeria Informàtica ,Xarxes neuronals ,COVID-19 ,Imatge mèdica ,Deep learning ,Redes neuronales ,Procesamiento de imagen ,Medical images ,Processament d’imatge ,Image processing ,Aprenentatge automàtic ,Machine learning ,Imagen médica ,LENGUAJES Y SISTEMAS INFORMATICOS ,Neural networks ,Aprenentatge profund - Abstract
[CA] En aquests moments estem vivint una pandèmia mundial causada pel SARSCoV-2, un virus que produeix una enfermetat infecciosa coneguda com COVID19 que provoca, entre altres, malalties respiratòries, com pneumònia en casos greus. Aquest projecte es centra en l’anàlisi d’imatge mèdica per a la detecció de pneumònia a partir de radiografies pulmonars per tal d’ajudar a la lluita contra la pandèmia. Durant el projecte s’utilitzaran tècniques d’aprenentatge profund per a construir diversos classificadors amb l’ús de xarxes neuronals convolucionals que siguen capaços de detectar la infecció. La finalitat és que aquests classificadors puguen ajudar al personal mèdic a la criva de pacients que presenten simptomatologies durant la pandèmia. S’utilitzarà un conjunt d’imatges de radiografies pulmonars proporcionat pel Banc digital d’Imatge Mèdica de la Comunitat Valenciana -BIMCV-, les quals entrenaran els models construïts. [ES] En estos momentos estamos viviendo una pandemia mundial causada por el SARS-CoV-2, un virus que produce una enfermedad infecciosa que se conoce como COVID-19, la cual provoca, entre otras, enfermedades respiratorias, como neumonía en casos graves. Este proyecto se centra en el análisis de imagen médica para la detección de neumonía a partir de radiografías pulmonares con tal de ayudar en la lucha contra la pandemia. Durante el proyecto se usarán técnicas de aprendizaje profundo para construir diversos clasificadores utilizando redes neuronales convolucionales los cuales sean capaces de detectar la infección. La finalidad es que estos clasificadores puedan ayudar al personal médico en el triaje de pacientes que presenten sintomatologías durante la pandemia. Se utilizará un conjunto de imágenes de radiografías pulmonares proporcionado por el Banco digital de Imagen Médica de la Comunidad Valenciana -BIMCV-, las cuales entrenarán los modelos construidos. [EN] Nowadays we are experiencing a worldwide pandemic caused by the SARSCoV-2, a virus that produces an infectious disease known as COVID-19, which causes, among others, respiratory diseases, such as pneumonia in severe cases. This project is focused on medical image analysis for the detection of pneumonia from lung X-ray images in order to fight against the pandemic. During the project, deep learning techniques will be used to build various classifiers that can detect the infection. The purpose is that these classifiers will be able to help medical personnel at the screening of patients presenting symptomatologies during the pandemic. A set of lung X-ray images provided by the Medical Imaging Databank of the Valencia Region -BIMCV- will be used to train the built models. Aquest projecte s’ha desenvolupat en col·laboració amb l’equip del projecte DeepHealth1 del centre d’investigació Pattern Recognition and Human Language Technology, el qual ha intentat aportar models de Deep Learning per al problema plantejat pel Banc digital d’Imatge Mèdica de la Comunitat Valenciana, tal com estaven fent altres equips.
- Published
- 2020
43. Aprendizaje automatizado basado en transformadas wavelet para la segmentación de hojas en imágenes infrarrojas
- Author
-
Universidad Politécnica de Cartagena, Pérez Sanz, Fernando, Navarro Lorente, Pedro Javier, Egea Gutiérrez-Cortines, Marcos, Weiss, Julia Rosl, Universidad Politécnica de Cartagena, Pérez Sanz, Fernando, Navarro Lorente, Pedro Javier, Egea Gutiérrez-Cortines, Marcos, and Weiss, Julia Rosl
- Abstract
[SPA] En este trabajo se presenta un algoritmo de segmentación basado en máquinas de aprendizaje para la segmentación de hojas sobre imágenes NIR (Near-Infra-Red). El método de segmentación utiliza un vector de características extraído de diferentes niveles de la transformada wavelet. Para el desarrollo del algoritmo se han probado tres clasificadores: el vecino más cercano (KNN), un clasificador Bayesiano (NBC) y las máquinas de soporte compacto (SVM). Los métodos de aprendizaje han sido validados mediante el análisis de las curvas ROC y el máximo rendimiento fue obtenido por la SVM con un 98.33%. [ENG] In this work we present an algorithm to segment leaves in NIR images captured inside a growth chamber. The proposed method uses a features vector composed by four elements extracted from different levels of wavelets transform. We have tested three classifiers: k-nearest neighbour (kNN), Naive Bayes classifier (NBC) and Support Vector Machine to determine the optimal machine learning algorithm to carry out the leaf segmentation. Method developed has been validated by means of the Receiver Operating Characteristic (ROC) curve and it has obtained a maximum performance of 98.33% in the leaf segmentation using SVM classifier.
- Published
- 2019
44. Diseño y configuración de un sistema aéreo no tripulado con capacidad de procesamiento de imagen
- Author
-
Rodas Jordá, Ángel, Universitat Politècnica de València. Departamento de Informática de Sistemas y Computadores - Departament d'Informàtica de Sistemes i Computadors, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Marco Estevens, Miguel, Rodas Jordá, Ángel, Universitat Politècnica de València. Departamento de Informática de Sistemas y Computadores - Departament d'Informàtica de Sistemes i Computadors, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Marco Estevens, Miguel
- Abstract
[ES] En el presente trabajo final de grado se aborda el diseño y construcción de un sistema aéreo no tripulado —de ahora en adelante UAS1— que está formado por un dron hexacóptero, una estación de control en tierra implementada en un computador basado en Ubuntu y el sistema de comunicación entre ambos. Se han diseñado los componentes tanto hardware como software necesarios basándose en una filosofía de código abierto para así poder realizar el montaje del vehículo y la configuración de estos partiendo de un sistema operativo virgen al que se le ha ido instalando todo lo necesario según iba siendo requerido. El sistema tiene un modo básico de trabajo denominado RPAS en el que el vehículo es pilotado remotamente desde la estación de control en tierra, otro modo —el guiado— en el que se le indicará por comandos las acciones a realizar y, finalmente, un tercer modo en el que el vehículo tiene un comportamiento más autónomo, pues es capaz de desplazarse gracias a la retroalimentación obtenida a través de las imágenes que recibe a partir de la cámara que tiene instalada en su cara delantera., [CA] En el present treball final de grau s’aborda el disseny i construcció d’un sistema aeri no tripulat —d'ara endavant UAS— que està format per un dron hexacòpter, una estació de control en terra implementada en un ordinador basat en Ubuntu i el sistema de comunicació entre tots dos. S'han dissenyat els components tant maquinari com programari necessaris basant-se en una filosofia de codi obert per així poder realitzar el muntatge del vehicle i la configuració dels mateixos partint d'un sistema operatiu verge al qual se li ha anat instal·lant tot el necessari segons anava sent requerit. El sistema té una manera bàsica de treball denominat RPAS (Remotely-Piloted Aircraft System) en el qual el vehicle és pilotat remotament des de l'estació de control en terra, una altra manera —el guiat— en què se li indicarà per comandos les accions a realitzar i, finalment, una tercera manera en què el vehicle té un comportament més autònom, ja que és capaç de desplaçar-se gràcies a la retroalimentació obtinguda a través de les imatges que rep a partir de la càmera que té instal·lada a la seva cara davantera, [EN] In the present final grade work the design and construction of an unmanned aerial system is addressed —hereafter UAS— which is formed by a hexacopter drone, a ground control station implemented in a computer based on Ubuntu and the system of communication between both. The necessary hardware and software components have been designed based on an open source philosophy to be able to assemble the vehicle and its configuration starting from a virgin operating system that has been installed everything necessary as it was being required. The system has a basic mode of work called RPAS (Remotely-Piloted Aircraft System) in which the vehicle is piloted remotely from the ground control station, another mode —guidance— in which it will be indicated by commands the actions to be carried out and, finally, a third way in which the vehicle has a more autonomous behaviour, because it is able to move thanks to the feedback obtained through the images it receives from the camera it has installed in your front face
- Published
- 2019
45. 3D histologia, RGB-tik 3D-ra: 3D inpresio bidezko histologia objektu baten sorkuntza
- Author
-
Eguiraun Martínez, Harkaitz, E.T.S. INGENIERIA -BILBAO, BILBOKO INGENIARITZA G.E.T., Industria Teknologiaren Ingeniaritzako Gradua, Grado en Ingeniería en Tecnología Industrial, Mantxola Akizu, Asier, Eguiraun Martínez, Harkaitz, E.T.S. INGENIERIA -BILBAO, BILBOKO INGENIARITZA G.E.T., Industria Teknologiaren Ingeniaritzako Gradua, Grado en Ingeniería en Tecnología Industrial, and Mantxola Akizu, Asier
- Abstract
Informazio kantitate handiak transmititzeko duten gaitasuna dela eta, irudiek izugarrizko garrantzia dute zientzia zein hezkuntza munduan. Teknologia berrien garapenarekin urtetik urtera handituz doa grafikoek, diagramek, argazkiek edota maketek gaur egungo gizartean duten garrantzia. Ondorioz, ikusmen arazoak dituzten pertsonek informazioa eskuratzeko geroz eta arazo gehiago dituzte. Lan honetan metodologia bat garatu da non histologiako 5 irudi aztertu, prozesatu eta 3D inprimaketarako artxibo gisa moldatuko diren., Las imágenes siempre han sido importantes en el ámbito científico-educativo, por su capacidad para transmitir grandes cantidades de información. Cada año se incrementa el peso de los gráficos, diagramas, fotografías o maquetas en este campo. Por lo tanto, las personas con alguna discapacidad visual tienen cada vez más problemas para acceder a dicha información. En este trabajo se desarrolla una metodología para analizar, procesar y crear 5 archivos de impresión 3D correspondientes a 5 imagenes del ámbito de la histologia., Due to their ability to transmit large amount of information, images have always been important in the scientific-educational field. The use of graphics, diagrams, photographs or models in these fields is increasing. Therefore, people with visual impairment have more problems while accessing this kind of information. In this work, a methodology for analyze, process and create a 3D printing archive from 5 histology images is carried out.
- Published
- 2019
46. Optimización computacional de algoritmos de análisis de biomarcadores de imagen de Resonancia Magnética mediante modelos dinámicos en Oncología
- Author
-
Bosch Roig, Ignacio, Ten Esteve, Amadeo, Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions, Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació, Torres Alberola, Alejandro, Bosch Roig, Ignacio, Ten Esteve, Amadeo, Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions, Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació, and Torres Alberola, Alejandro
- Abstract
[ES] El proyecto se realizará en un marco colaborativo con el Grupo de Investigación Biomédica en Imagen (GIBI230) del Hospital Universitario y Politécnico La Fe y parte de un desarrollo previo de algoritmos para el procesamiento de imágenes médicas para la extracción de biomarcadores de imagen a partir de imágenes de Resonancia Magnética de Difusión y Perfusión en el ámbito oncológico. Los algoritmos previos han sido ya desarrollados e implementados, pero pueden optimizarse computacionalmente para reducir su tiempo de ejecución. Este proyecto se centrará en realizar un análisis detallado de las diferentes partes del proceso: lectura de imágenes, preprocesado, ajuste de curvas por mínimos cuadrados y extracción de biomarcadores. El objetivo será conseguir una optimización del proceso persiguiendo una aceleración de la ejecución y cometiendo el menor error posible en los cálculos de los biomarcadores. Para ello, se partirá de algoritmos en Matlab, donde la tarea computacionalmente más demandante la realiza la función iterativa Isqcurvefit, que ajusta los modelos dinámicos a los datos de forma no lineal mediante mínimos cuadrados. Finalmente se comprobará el grado de éxito del proyecto al comparar el tiempo de ejecución original y el alcanzado durante el proyecto así como el error cometido en el análisis, tomando como referencia los resultados que se están obteniendo en la actualidad., [EN] The project will be carried out in a collaborative framework with the Grupo de Investigación Biomédica en Imagen (GIBI230) of the Hospital Universitario y Politécnico La Fe and starts from a previous development for the medical image processing for extracting image biomarkers from Magnetic Resonance Imaging of Diffusion and Perfusion in the oncologic domain. The previous algorithms have already been developed and implemented, but can be optimized computationally to reduce their execution time. This project focuses on a detailed analysis of the different parts of the process: Reading of images, preprocessing, adjustment by least squares curves and extraction of biomarkers. The objective will be to achieve optimization of the process by pursuing an acceleration of execution and making the smallest possible error in the calculations of the biomarkers. To do this, we will start with algorithms in Matlab, where the computationally most demanding task is performed by the Isqcurvefit iterative function, which adjusts the dynamic models to the data in a nonlinear way using least squares. Finally, the degree of success of the project will be checked by comparing the original execution time and the time achieved during the project, as well as the error committed in the analysis, taking as reference the results that are currently being obtained.
- Published
- 2019
47. Deteccion de puntos clave en caras mediante redes neuronales profundas
- Author
-
Albiol Colomer, Alberto, Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions, Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació, Lluesma Martí, Enrique, Albiol Colomer, Alberto, Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions, Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació, and Lluesma Martí, Enrique
- Abstract
[ES] El objetivo de este proyecto es el análisis de diferentes estructuras de regresión para la detección de puntos clave en imágenes, así como de diferentes hiper-parámetros. Se particularizá para el problema de puntos claves en rostros humanos.
- Published
- 2019
48. Anàlisi d’imatge mèdica del cervell per donar suport al diagnòstic
- Author
-
Gómez Adrian, Jon Ander, De la Iglesia Vayá, Maria de los Desamparados, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Nadal Almela, Silvia, Gómez Adrian, Jon Ander, De la Iglesia Vayá, Maria de los Desamparados, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Nadal Almela, Silvia
- Abstract
[CA] Durant aquest projecte s’ha treballat amb imatges mèdiques disponibles gràcies a la col·laboració entre el centre d’investigació Pattern Recognition and Human Language Technology –PRHLT– i la Fundació per al Foment de la Investigació Sanitària i Biomèdica de la Comunitat Valenciana –FISABIO–. La finalitat última d’aquest projecte ha sigut construir un classificador per a cada tipus d’imatge segons l’etapa de la malaltia Alzhèimer en què es troba el pacient. Els classificadors han estat basats tant en Deep Learning, alguns utilitzant Convolutional Neural Networks, com en mètodes clàssics de Machine Learning. Abans d’entrenar els classificadors, s’ha avaluat la qualitat dels conjunts de dades i s’ha fet un estudi de les seues característiques. Finalment, s’han comparat els resultats obtinguts amb les diferents tècniques emprades, [ES] Durante este proyecto se ha trabajado con imágenes médicas disponibles gracias a la colaboración entre el centro de investigación Pattern Recognition and Human Language Technology –PRHLT– y la Fundación para el Fomento de la Investigación Sanitaria y Biomédica de la Comunidad Valenciana –FISABIO–. La finalidad última de este proyecto ha sido construir un clasificador para cada tipo de imagen según la etapa de la enfermedad Alzheimer en que se encuentra el paciente. Los clasificadores se han basado tanto en Deep Learning, algunos utilizando Convolutional Neural Networks, como en métodos clásicos de Machine Learning. Antes de entrenar los clasificadores, se ha evaluado la calidad de los conjuntos de datos y se ha hecho un estudio de sus características. Finalmente, se han comparado los resultados obtenidos con las diferentes técnicas empleadas., [EN] During this project we have worked with medical images that are available thanks to the collaboration between the research center Pattern Recognition and Human Language Technology (PRHLT) and the Foundation for the Promotion of Health and Biomedical Research of Valencia Region (FISABIO). The final goal of this project has been building a classifier for each kind of image according to the stage of Alzheimer’s disease of each patient. These classifiers have been based on both Deep Learning, some using Convolutional Neural Networks, and classical methods of Machine Learning. Before training the classifiers, the quality of the data sets has been evaluated and a study of their characteristics has been performed. Finally, the different results obtained with these techniques have been compared.
- Published
- 2019
49. Clasificación de lesiones en la piel con un ensemble de redes neuronales residuales
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Vilaplana Besler, Verónica, Combalia, Marc, Tarrés Benet, Laia, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Vilaplana Besler, Verónica, Combalia, Marc, and Tarrés Benet, Laia
- Abstract
Proyecto en colaboración con la unidad de Dermatología del Hospital Clínico de Barcelona, Convolutional Neural Networks have gained popularity in the recent years due to their performance regarding image analysis, both in classification and segmentation. Especially in the medical field, it is increasingly common to use automatic techniques to help specialists with the diagnosis. In this thesis, the problem of skin lesion classification is studied. The study is based on the ISIC Challenges, given the collaboration with Hospital Clínic de Barcelona, and we help in the development of the database for the ISIC Challenge 2019. One of the key points of the development is obtaining a model that manages to classify with accuracy a database provided. To do so, we study residual neural networks and an ensemble of them to further improve the results. The purpose of this project, therefore is the study, analysis and evaluation of the variants and modifications of residual neural networks so that it adapts to our problem using an ensemble of them. In the process, the neural network will have to tackle the problem of class imbalance., Las Redes Neuronales Convolucionales se han popularizado gracias a sus prestaciones respecto al análisis de imágenes, tanto clasificación como segmentación. Especialmente en el ámbito de la medicina es cada vez más común el uso de técnicas automáticas para ayudar a los especialistas con el diagnóstico. En este trabajo, se estudia el problema de clasificación de lesiones en la piel. Basándonos en los retos de ISIC, dado la colaboración con el Hospital Clínic de Barcelona y ayudando con el desarrollo de la base de datos del challenge ISIC2019. Unos de los puntos claves del desarrollo de este proyecto es la obtención de un modelo que consiga clasificar correctamente las imágenes de una base de datos proporcionada. Para ellos, se estudian las redes neuronales residuales y la técnica de ensembling para mejorar los resultados. El propósito de este proyecto, por lo tanto es el estudio, el análisis y la evaluación de las variantes y modificaciones de redes neuronales residuales para que se adapte a nuestro problema utilizando un ensemble de ellas. En el proceso se deberá afrontar el reto de la desproporción entre clases., Les Xarxes Neuronals Convolucionals s'han popularitzat gràcies a les seves prestacions vers l'anàlisi d'imatges, tant en classificació com en segmentació. Especialment dins l'àmbit de la medicina cada vegada és més comú l'ús de tècniques automàtiques per ajudar als especialistes amb el diagnòstic. En aquest treball, s'estudia el problema de classificació de lesions a la pell. Basant-nos en els reptes proposats per ISIC, donada la col·laboració amb l'Hospital Clínic de Barcelona i ajudant al desenvolupament de la base de dades del repte ISIC2019. Un dels punts clau del desenvolupament del projecte és l'obtenció d'un model que aconsegueixi classificar amb certesa una base de dades proporcionada. Per fer-ho, s'estudien les xarxes neuronals residuals i la tècnica d'ensembling amb el fi de millorar els resultats. L'objectiu d'aquest projecte, per tant és l'estudi, anàlisi i avaluació de les variants i modificacions de xarxes neuronals residuals per tal que s'adapti al nostre problema utilitzant un ensemble de xarxes. En el procés s'haurà d'abordar el repte de la desproporció entre classes.
- Published
- 2019
50. Medición de distancias entre dos objetos a partir de procesamiento de imagen
- Author
-
Duarte Dick, Dennis Augusto, Domínguez, Sidney, Duarte Dick, Dennis Augusto, and Domínguez, Sidney
- Abstract
Based on the need for software that would allow us to measure distances between two objects from image processing, a control software was developed in Labview to obtain distances in pixels and later in real distance. The software was designed, with the tools that Labview has for image processing, to be able to obtain these distances between objects., En base a la necesidad de un software que nos permitiera hacer la medición de distancias entre dos objetos a partir de procesamiento de imagen, se desarrolló un software de control en Labview para la obtención de las distancias en pixel y posteriormente en distancia real. El software se diseñó, con las herramientas que tiene Labview de procesamiento de imagen, para poder obtener estas distancias entre los objetos.
- Published
- 2019
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.