1. Modelo computacional para reconocimiento de lenguaje de señas en un contexto colombiano
- Author
-
Jorge E. Camargo-Mendoza and Nelson Ortiz-Farfán
- Subjects
modelo computacional ,Computer science ,Video camera ,02 engineering and technology ,Sign language ,computer.software_genre ,lcsh:Technology ,Task (project management) ,law.invention ,Machine Learning ,lenguaje de señas ,Software ,law ,Factor (programming language) ,0202 electrical engineering, electronic engineering, information engineering ,sign language ,computer.programming_language ,Training set ,lcsh:T ,business.industry ,personas sordas ,020207 software engineering ,Public repository ,computational model ,Aprendizaje de Maquina ,lcsh:TA1-2040 ,aprendizaje de maquina ,020201 artificial intelligence & image processing ,Artificial intelligence ,Personas sordas ,lcsh:Engineering (General). Civil engineering (General) ,business ,computer ,Deaf people ,Natural language processing ,Meaning (linguistics) - Abstract
Resumen Este documento presenta la implementación de un software de reconocimiento de lenguaje de señas colombiano para personas sordas. Para este propósito, el Aprendizaje de Máquina será usado como base del sistema específico. Hoy en día no existe un repositorio público de imágenes o video que contenga estas señas ni la información necesaria para alcanzar esta meta, siendo uno de los principales impedimentos para iniciar la tarea. Por esta razón, se comenzó con la construcción de un repositorio. Pese a las dificultades de tiempo de los participantes, cinco personas realizaron las señas ante una cámara de video, de donde se obtuvieron las imágenes que compondrían el repositorio. Una vez hecho esto, las imágenes se usaron como datos de entrenamiento de un modelo computacional óptimo que puede predecir el significado de una nueva imagen presentada. Evaluamos el rendimiento del método utilizando medidas de clasificación y comparando diferentes modelos. La medición conocida como Accuracy fue un factor importante para medir los diferentes modelos obtenidos y así elegir el más adecuado. Los resultados muestran que es posible proporcionar nuevas herramientas a las personas sordas para mejorar la comunicación con otras personas que no conocen el lenguaje de señas. Una vez que se han elegido los mejores modelos, se prueban con nuevas imágenes, similares a las del entrenamiento, donde se puede ver que el mejor modelo logra una tasa de éxito de alrededor del 68 % de las 22 clases utilizadas en el sistema. Abstract This document presents the implementation of a Colombian sign language recognition software for deaf people. For this purpose, Machine Learning will be used as the basis of the specific system. Today there is no public repository of images or video that contains these signs or the information necessary to achieve this goal, being one of the main obstacles to undertake the task. For this reason, the construction of a repository was started. Despite the time constraints of the participants, five people carried out the signs in front of a video camera, from which the images that would make up the repository were obtained. Once this was done, the images were used as training data for an optimal computer model that can predict the meaning of a new image presented. We evaluated the performance of the method using classification measures and comparing different models. The measurement known as Accuracy was an important factor in measuring the different models obtained and thus choosing the one most suitable. Results show that it is possible to provide new tools to deaf people to improve communication with others who do not know sign language. Once the best models have been chosen, they are tested with new images, similar to those in the training, where it can be seen that the best model achieves a success rate of around 68 % of the 22 classes used in the system.
- Published
- 2020
- Full Text
- View/download PDF