51. Reconocimiento de objetos en Android para aplicaciones de asistencia
- Author
-
Márquez Ferrer, Alejandro, Murillo Arnal, Ana Cristina, and Suárez Gracia, Darío
- Abstract
La capacidad de identificar y reconocer objetos es una tarea que la percepción del ser humano realiza sin problemas y de manera rutinaria. Sin embargo, crear un sistema informático capaz de igualar estas capacidades sigue siendo uno de los principales campos de investigación dentro de la disciplina de la visión por computador, VC. Esta razón unida a las posibilidades de ayuda que la VC puede ofrecer a personas con necesidades especiales han sido los acicates que han dado lugar a este trabajo. Además, en los últimos años los smartphone han experimentado una gran evolución en términos de potencia, haciendo que cada persona tenga un “mini-ordenador” en el bolsillo. Por ello, se ha enfocado el trabajo hacia esta plataforma y se han evaluado distintos algoritmos reconocedores para implementarlos en un pequeño prototipo de asistencia al usuario que, en tiempo real, sea capaz de identificar qué objetos que aparezcan en la cámara y listar los alérgenos que contiene. Se han investigado dos tipos de algoritmos distintos para el reconocimiento de los objetos: uno basado en local features, que puede ser ejecutado tanto en local como en modo cliente-servidor, y otro basado en técnicas más novedosas, concretamente Deep Learning, que debido a que es más exigente en términos de recursos sólo podrá ser ejecutado en modo cliente-servidor. Como punto de partida, se ha creado una base de datos de objetos propios de un supermercado. A continuación, se ha implementado un reconocedor de objetos basado en local features, y se ha investigado y evaluado qué algoritmos de reconocimiento funcionaban mejor con esa base de datos. Una vez elegido el que se ha considerado más óptimo, se ha implementado ese mismo reconocedor en modo cliente-servidor. Después, se ha implementado el reconocedor basado en Deep Learning, y se han evaluado sus resultados. Por último, se han comparado el rendimiento y los resultados obtenidos entre las distintas técnicas y arquitecturas, y se han extraı́do conclusiones acerca de ellos: ventajas, desventajas de cada uno y posibles mejoras. Finalmente, se ha desarrollado un pequeño prototipo, consistente en una aplicación de asistencia cuya función es reconocer los objetos de la base de datos creada a través de la cámara del dispositivo e indicar la lista de alérgenos que contienen, todo ello en tiempo real.
- Published
- 2016