27 results on '"Estévez-Velarde, Suilan"'
Search Results
2. Applying Human-in-the-Loop to construct a dataset for determining content reliability to combat fake news
- Author
-
Bonet-Jover, Alba, Sepúlveda-Torres, Robiert, Saquete, Estela, Martínez-Barco, Patricio, Piad-Morffis, Alejandro, and Estevez-Velarde, Suilan
- Published
- 2023
- Full Text
- View/download PDF
3. General-purpose hierarchical optimisation of machine learning pipelines with grammatical evolution
- Author
-
Estevez-Velarde, Suilan, Gutiérrez, Yoan, Almeida-Cruz, Yudivián, and Montoyo, Andrés
- Published
- 2021
- Full Text
- View/download PDF
4. KD SENSO-MERGER: An architecture for semantic integration of heterogeneous data
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Gutiérrez, Yoan, Abreu Salas, José Ignacio, Montoyo, Andres, Muñoz, Rafael, Estévez-Velarde, Suilan, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Gutiérrez, Yoan, Abreu Salas, José Ignacio, Montoyo, Andres, Muñoz, Rafael, and Estévez-Velarde, Suilan
- Abstract
This paper presents KD SENSO-MERGER, a novel Knowledge Discovery (KD) architecture that is capable of semantically integrating heterogeneous data from various sources of structured and unstructured data (i.e. geolocations, demographic, socio-economic, user reviews, and comments). This goal drives the main design approach of the architecture. It works by building internal representations that adapt and merge knowledge across multiple domains, ensuring that the knowledge base is continuously updated. To deal with the challenge of integrating heterogeneous data, this proposal puts forward the corresponding solutions: (i) knowledge extraction, addressed via a plugin-based architecture of knowledge sensors; (ii) data integrity, tackled by an architecture designed to deal with uncertain or noisy information; (iii) scalability, this is also supported by the plugin-based architecture as only relevant knowledge to the scenario is integrated by switching-off non-relevant sensors. Also, we minimize the expert knowledge required, which may pose a bottleneck when integrating a fast-paced stream of new sources. As proof of concept, we developed a case study that deploys the architecture to integrate population census and economic data, municipal cartography, and Google Reviews to analyze the socio-economic contexts of educational institutions. The knowledge discovered enables us to answer questions that are not possible through individual sources. Thus, companies or public entities can discover patterns of behavior or relationships that would otherwise not be visible and this would allow extracting valuable information for the decision-making process.
- Published
- 2024
5. Optimizing Natural Language Processing Pipelines: Opinion Mining Case Study
- Author
-
Estevez-Velarde, Suilan, Gutiérrez, Yoan, Montoyo, Andrés, Almeida-Cruz, Yudivián, Goos, Gerhard, Founding Editor, Hartmanis, Juris, Founding Editor, Bertino, Elisa, Editorial Board Member, Gao, Wen, Editorial Board Member, Steffen, Bernhard, Editorial Board Member, Woeginger, Gerhard, Editorial Board Member, Yung, Moti, Editorial Board Member, Nyström, Ingela, editor, Hernández Heredia, Yanio, editor, and Milián Núñez, Vladimir, editor
- Published
- 2019
- Full Text
- View/download PDF
6. Applying Human-in-the-Loop to construct a dataset for determining content reliability to combat fake news
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Instituto Universitario de Investigación Informática, Bonet-Jover, Alba, Sepúlveda-Torres, Robiert, Saquete Boró, Estela, Martínez-Barco, Patricio, Piad-Morffis, Alejandro, Estévez-Velarde, Suilan, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Instituto Universitario de Investigación Informática, Bonet-Jover, Alba, Sepúlveda-Torres, Robiert, Saquete Boró, Estela, Martínez-Barco, Patricio, Piad-Morffis, Alejandro, and Estévez-Velarde, Suilan
- Abstract
Annotated corpora are indispensable tools to train computational models in Natural Language Processing. However, in the case of more complex semantic annotation processes, it is a costly, arduous, and time-consuming task, resulting in a shortage of resources to train Machine Learning and Deep Learning algorithms. In consideration, this work proposes a methodology, based on the human-in-the-loop paradigm, for semi-automatic annotation of complex tasks. This methodology is applied in the construction of a reliability dataset of Spanish news so as to combat disinformation and fake news. We obtain a high quality resource by implementing the proposed methodology for semi-automatic annotation, increasing annotator efficacy and speed, with fewer examples. The methodology consists of three incremental phases and results in the construction of the RUN dataset. The annotation quality of the resource was evaluated through time-reduction (annotation time reduction of almost 64% with respect to the fully manual annotation), annotation quality (measuring consistency of annotation and inter-annotator agreement), and performance by training a model with RUN semi-automatic dataset (Accuracy 95% F1 95%), validating the suitability of the proposal.
- Published
- 2023
7. Resumen de la Tarea de Descubrimiento de Conocimiento en Salud en IberLEF 2021
- Author
-
Piad-Morffis, Alejandro, Estévez-Velarde, Suilan, Gutiérrez, Yoan, Almeida-Cruz, Yudivian, Montoyo, Andres, Muñoz, Rafael, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
- Subjects
Tarea ,Lenguajes y Sistemas Informáticos ,Extracción de Relaciones ,Challenge ,Knowledge Discovery ,Descubrimiento de Conocimiento ,Named Entity Recognition ,Relation Extraction ,Reconocimiento de Entidades Nombradas - Abstract
This paper summarises the eHealth Knowledge Discovery Challenge hosted at IberLEF 2021. We describe the task, resources, and participating systems, highlighting and discussing the main results achieved in the challenge. We analyse the best performing systems and present recommendations for future research. Este artículo resume la Tarea de Descubrimiento de Conocimiento en Salud presentada en IberLEF 2021. Se describen la tarea, los recursos creados, y los sistemas que participaron. Se discuten los resultados principales obtenidos por estos sistemas, y se presentan recomendaciones para continuar la investigación en esta temática. This research has been supported by a Carolina Foundation grant in agreement with University of Alicante and University of Havana. Moreover, the research has been partially funded by the University of Alicante and the University of Havana, the Generalitat Valenciana (Conselleria d'Educació, Investigació, Cultura i Esport) and the Spanish Government through the projects LIVING-LANG (RTI2018-094653-B-C22), INTEGER (RTI2018-094649-B-I00) and SIIA (PROMETEO/2018/089, PROMETEU/2018/089). Additionally, it has been backed by the work of both COST Actions: CA19134 – “Distributed Knowledge Graphs” and CA19142 – “Leading Platform for European Citizens, Industries, Academia and Policymakers in Media Accessibility”.
- Published
- 2021
8. Hacia la democratización del aprendizaje de máquinas usando AutoGOAL
- Author
-
Estevanell-Valladares, Ernesto L., Estévez-Velarde, Suilan, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Montoyo, Andres, Almeida-Cruz, Yudivian, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
- Subjects
Artificial intelligence ,Automated learning ,Machine learning ,Lenguajes y Sistemas Informáticos ,Aprendizaje de máquinas ,Aprendizaje automatizado ,AutoML ,Inteligencia artificial - Abstract
El aprendizaje automático es un campo de la inteligencia artificial que ha ganado un reciente interés en todas las áreas de la industria, motivado fundamentalmente por el acelerado crecimiento de las capacidades de cómputo y la disponibilidad de datos. Sin embargo, una de las principales dificultades para su aplicación es la necesidad de expertos que conozcan los detalles internos de los múltiples modelos que pueden ser utilizados. En este contexto ha surgido un nuevo campo de estudio, denominado AutoML (Automated Machine Learning), que facilita la utilización de estas técnicas por expertos de otros dominios. Este artículo presenta una propuesta concreta de un sistema —AutoGOAL— que ha sido diseñada para resolver problemas de aprendizaje automático de variada naturaleza. Además, se realiza una breve comparación entre sistemas existentes de relevancia en el campo. La propuesta es competitiva con herramientas del estado del arte en problemas clásicos de aprendizaje, a la vez que puede desplegarse, sin esfuerzo adicional, en dominios más complejos, como el procesamiento de lenguaje natural. AutoGOAL constituye un paso más hacia la democratización del aprendizaje automático para usuarios no expertos en el tema. Machine Learning is a field of Artificial Intelligence that has gained recent interest in all areas of the industry, motivated primarily by the accelerated growth of computer capabilities and data availability. However, one of the main difficulties for its application is the need for experts who know the internal details of the multiple models that can be used. In this context, a new field of study has emerged, AutoML (Automated Machine Learning), which facilitates the use of these techniques by experts from other domains. This paper presents a concrete proposal of a system —AutoGOAL— which has been designed to solve machine learning problems of various kinds. In addition, a brief comparison is made between relevant existing systems in the field. The proposal is competitive with state-of-the-art tools in classic machine learning problems, and it can be seamlessly deployed in more complex domains, such as natural language processing. AutoGOAL is another step towards the democratization of machine learning for non-expert users.
- Published
- 2021
9. Descubrimiento Automático de Flujos de Aprendizaje de Máquina basado en Gramáticas Probabilı́sticas
- Author
-
Estévez-Velarde, Suilan, Gutiérrez, Yoan, Montoyo, Andres, Almeida-Cruz, Yudivian, and Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
- Subjects
Algoritmos evolutivos ,Lenguajes y Sistemas Informáticos ,Tecnologías del Lenguaje Humano ,Aprendizaje Automático ,Gramática ,AutoML - Abstract
El aprendizaje de máquinas ha ganado terreno utilizándose en casi todas las áreas de la vida cotidiana, ayudando a tomar decisiones en las finanzas, la medicina, el comercio y el entretenimiento. El desarrollo continuo de nuevos algoritmos y técnicas de aprendizaje automático, y la amplia gama de herramientas y conjuntos de datos disponibles han traído nuevas oportunidades y desafíos para investigadores y profesionales tanto del mundo académico como de la industria. Seleccionar la mejor estrategia posible para resolver un problema de aprendizaje automático es cada vez más difícil, en parte porque requiere largos tiempos de experimentación y profundos conocimientos técnicos. En este escenario, el campo de investigación Automated Machine Learning (AutoML) ha ganado protagonismo, proponiendo estrategias para automatizar progresivamente tareas usuales durante el desarrollo de aplicaciones de aprendizaje de máquina. Las herramientas de AutoML más comunes permiten seleccionar automáticamente dentro de un conjunto restringido de algoritmos y parámetros la mejor estrategia para cierto conjunto de datos. Sin embargo, los problemas prácticos a menudo requieren combinar y comparar algoritmos heterogéneos implementados con diferentes tecnologías subyacentes. Un ejemplo es el procesamiento del lenguaje natural, un escenario donde varía el espacio de posibles técnicas a aplicar ampliamente entre diferentes tareas, desde el preprocesamiento hasta la representación y clasificación de textos. Realizar AutoML en un escenario heterogéneo como este es complejo porque la solución necesaria podría incluir herramientas y bibliotecas no compatibles entre sí. Esto requeriría que todos los algoritmos acuerden un protocolo común que permita la salida de un algoritmo para ser compartida como entradas a cualquier otro. En esta investigación se diseña e implementa un sistema de AutoML que utiliza técnicas heterogéneas. A diferencia de los enfoques de AutoML existentes, nuestra contribución puede combinar técnicas y algoritmos de diferentes bibliotecas y tecnologías, incluidos algoritmos de aprendizaje de máquina clásicos, extracción de características, herramientas de procesamiento de lenguaje natural y diversas arquitecturas de redes neuronales. Definimos el problema heterogéneo de optimización de AutoML como la búsqueda de la mejor secuencia de algoritmos que transforme datos de entrada específicos en la salida deseada. Esto proporciona un enfoque teórico y práctico novedoso para AutoML. Nuestra propuesta se evalúa experimentalmente en diversos problemas de aprendizaje automático y se compara con enfoques alternativos, lo que demuestra que es competitiva con otras alternativas de AutoML en los puntos de referencia estándar. Además, se puede aplicar a escenarios novedosos, como varias tareas de procesamiento de lenguaje natural, donde las alternativas existentes no se pueden implementar directamente. El sistema está disponible de forma gratuita e incluye compatibilidad incorporada con una gran cantidad de marcos de aprendizaje automático populares, lo que hace que nuestro enfoque sea útil para resolver problemas prácticos con relativa facilidad y esfuerzo. El uso de la herramienta propuesta en esta investigación permite a los investigadores y profesionales desarrollar rápidamente algoritmos de referencia optimizados en diversos problemas de aprendizaje automático. En algunos escenarios, la solución proporcionada por nuestro sistema podría ser suficiente. Sin embargo, los sistemas AutoML no deben intentar reemplazar a los expertos humanos, sino servir como herramientas complementarias que permitan a los investigadores obtener rápidamente mejores prototipos y conocimientos sobre las estrategias más prometedoras en un problema concreto. Las técnicas de AutoML abren las puertas a revolucionar la forma en que se realiza la investigación y el desarrollo del aprendizaje automático en la academia y la industria.
- Published
- 2021
10. Hacia la democratización del aprendizaje de máquinas usando AutoGOAL
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estevanell-Valladares, Ernesto L., Estévez-Velarde, Suilan, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Montoyo, Andres, Almeida-Cruz, Yudivian, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estevanell-Valladares, Ernesto L., Estévez-Velarde, Suilan, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Montoyo, Andres, and Almeida-Cruz, Yudivian
- Abstract
El aprendizaje automático es un campo de la inteligencia artificial que ha ganado un reciente interés en todas las áreas de la industria, motivado fundamentalmente por el acelerado crecimiento de las capacidades de cómputo y la disponibilidad de datos. Sin embargo, una de las principales dificultades para su aplicación es la necesidad de expertos que conozcan los detalles internos de los múltiples modelos que pueden ser utilizados. En este contexto ha surgido un nuevo campo de estudio, denominado AutoML (Automated Machine Learning), que facilita la utilización de estas técnicas por expertos de otros dominios. Este artículo presenta una propuesta concreta de un sistema —AutoGOAL— que ha sido diseñada para resolver problemas de aprendizaje automático de variada naturaleza. Además, se realiza una breve comparación entre sistemas existentes de relevancia en el campo. La propuesta es competitiva con herramientas del estado del arte en problemas clásicos de aprendizaje, a la vez que puede desplegarse, sin esfuerzo adicional, en dominios más complejos, como el procesamiento de lenguaje natural. AutoGOAL constituye un paso más hacia la democratización del aprendizaje automático para usuarios no expertos en el tema., Machine Learning is a field of Artificial Intelligence that has gained recent interest in all areas of the industry, motivated primarily by the accelerated growth of computer capabilities and data availability. However, one of the main difficulties for its application is the need for experts who know the internal details of the multiple models that can be used. In this context, a new field of study has emerged, AutoML (Automated Machine Learning), which facilitates the use of these techniques by experts from other domains. This paper presents a concrete proposal of a system —AutoGOAL— which has been designed to solve machine learning problems of various kinds. In addition, a brief comparison is made between relevant existing systems in the field. The proposal is competitive with state-of-the-art tools in classic machine learning problems, and it can be seamlessly deployed in more complex domains, such as natural language processing. AutoGOAL is another step towards the democratization of machine learning for non-expert users.
- Published
- 2021
11. Descubrimiento Automático de Flujos de Aprendizaje de Máquina basado en Gramáticas Probabilı́sticas
- Author
-
Gutiérrez, Yoan, Montoyo, Andres, Almeida-Cruz, Yudivian, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estévez-Velarde, Suilan, Gutiérrez, Yoan, Montoyo, Andres, Almeida-Cruz, Yudivian, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Estévez-Velarde, Suilan
- Abstract
El aprendizaje de máquinas ha ganado terreno utilizándose en casi todas las áreas de la vida cotidiana, ayudando a tomar decisiones en las finanzas, la medicina, el comercio y el entretenimiento. El desarrollo continuo de nuevos algoritmos y técnicas de aprendizaje automático, y la amplia gama de herramientas y conjuntos de datos disponibles han traído nuevas oportunidades y desafíos para investigadores y profesionales tanto del mundo académico como de la industria. Seleccionar la mejor estrategia posible para resolver un problema de aprendizaje automático es cada vez más difícil, en parte porque requiere largos tiempos de experimentación y profundos conocimientos técnicos. En este escenario, el campo de investigación Automated Machine Learning (AutoML) ha ganado protagonismo, proponiendo estrategias para automatizar progresivamente tareas usuales durante el desarrollo de aplicaciones de aprendizaje de máquina. Las herramientas de AutoML más comunes permiten seleccionar automáticamente dentro de un conjunto restringido de algoritmos y parámetros la mejor estrategia para cierto conjunto de datos. Sin embargo, los problemas prácticos a menudo requieren combinar y comparar algoritmos heterogéneos implementados con diferentes tecnologías subyacentes. Un ejemplo es el procesamiento del lenguaje natural, un escenario donde varía el espacio de posibles técnicas a aplicar ampliamente entre diferentes tareas, desde el preprocesamiento hasta la representación y clasificación de textos. Realizar AutoML en un escenario heterogéneo como este es complejo porque la solución necesaria podría incluir herramientas y bibliotecas no compatibles entre sí. Esto requeriría que todos los algoritmos acuerden un protocolo común que permita la salida de un algoritmo para ser compartida como entradas a cualquier otro. En esta investigación se diseña e implementa un sistema de AutoML que utiliza técnicas heterogéneas. A diferencia de los enfoques de AutoML existentes, nuestra contribución puede
- Published
- 2021
12. Overview of the eHealth Knowledge Discovery Challenge at IberLEF 2021
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Piad-Morffis, Alejandro, Estévez-Velarde, Suilan, Gutiérrez, Yoan, Almeida-Cruz, Yudivian, Montoyo, Andres, Muñoz, Rafael, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Piad-Morffis, Alejandro, Estévez-Velarde, Suilan, Gutiérrez, Yoan, Almeida-Cruz, Yudivian, Montoyo, Andres, and Muñoz, Rafael
- Abstract
This paper summarises the eHealth Knowledge Discovery Challenge hosted at IberLEF 2021. We describe the task, resources, and participating systems, highlighting and discussing the main results achieved in the challenge. We analyse the best performing systems and present recommendations for future research., Este artículo resume la Tarea de Descubrimiento de Conocimiento en Salud presentada en IberLEF 2021. Se describen la tarea, los recursos creados, y los sistemas que participaron. Se discuten los resultados principales obtenidos por estos sistemas, y se presentan recomendaciones para continuar la investigación en esta temática.
- Published
- 2021
13. GPLSI-UH LETO V1.0: Motor de aprendizaje a través de ontologías
- Author
-
Universidad de Alicante. Instituto Universitario de Investigación Informática, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estévez-Velarde, Suilan, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Montoyo, Andres, Muñoz, Rafael, Almeida-Cruz, Yudivian, Palomar, Manuel, Valdés Pérez, Daniel Alejandro, Universidad de Alicante. Instituto Universitario de Investigación Informática, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estévez-Velarde, Suilan, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Montoyo, Andres, Muñoz, Rafael, Almeida-Cruz, Yudivian, Palomar, Manuel, and Valdés Pérez, Daniel Alejandro
- Abstract
LETO es un marco de aprendizaje de ontologías diseñado para extraer conocimiento de una variedad de fuentes. Estas fuentes pudieran ser datos estructurados y no estructurados, y de ellas se podrá descubrir, actualizar continuamente, enriquecer e integrar información relevante como parte de un único conocimiento semántico. En la actual versión 1.0 se limita a la extracción de conocimiento desde datos no estructurados, i.e. textos en lenguaje natural, siguiendo el modelo semántico publicado en [EGM2018]. Entre sus funcionalidades está la extracción de entidades y relaciones semánticas desde fuentes textuales; la transformación de esta información en elementos interrelacionados mediante técnicas de agrupamientos; y finalmente generación de ontologías representativas del contenido procesado. Se proporciona un punto de acceso API, y una herramienta visual para la manipulación de procesos y visualización de las ontologías obtenidas [EMA2019]., LETO is an ontology learning framework designed to extract knowledge from a variety of sources. These sources may be structured and/or unstructured data, and from them we can discover, continuously update, enrich and integrate relevant information as part of a single semantic knowledge resource. The current 1.0 version is limited to the extraction of knowledge from unstructured data, i.e. natural language texts, following the semantic model published in [EGM2018]. Among this version’s functionalities are the extraction of entities and semantic relations from textual sources; the transformation of such information into linked elements through clustering techniques; and finally, the generation of representative ontologies of the processed content. An API access point as well as a visual tool for the manipulation of processes and visualization of the obtained ontologies is provided [EMA2019].
- Published
- 2021
14. General-purpose hierarchical optimisation of machine learning pipelines with grammatical evolution
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estévez-Velarde, Suilan, Gutiérrez, Yoan, Almeida-Cruz, Yudivian, Montoyo, Andres, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estévez-Velarde, Suilan, Gutiérrez, Yoan, Almeida-Cruz, Yudivian, and Montoyo, Andres
- Abstract
This paper introduces Hierarchical Machine Learning Optimisation (HML-Opt), an AutoML framework that is based on probabilistic grammatical evolution. HML-Opt has been designed to provide a flexible framework where a researcher can define the space of possible pipelines to solve a specific machine learning problem, which can range from high-level decisions about representation and features to low-level hyper-parameter values. The evaluation of HML-Opt is presented via two different case studies, both of which demonstrate that it is competitive with existing AutoML tools on a variety of benchmarks. Furthermore, HML-Opt can be applied to novel problems, such as knowledge extraction from natural language text, whereas other techniques are insufficiently flexible to capture the complexity of these scenarios. The source code for HML-Opt is available online for the research community.
- Published
- 2021
15. Overview of the eHealth Knowledge Discovery Challenge at IberLEF 2020
- Author
-
Piad-Morffis, Alejandro, Gutiérrez, Yoan, Cañizares-Diaz, Hian, Estévez-Velarde, Suilan, Muñoz, Rafael, Montoyo, Andres, Almeida-Cruz, Yudivian, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Instituto Universitario de Investigación Informática, and Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
- Subjects
Machine Learning ,Lenguajes y Sistemas Informáticos ,eHealth ,Knowledge Discovery ,Natural Language Processing - Abstract
This paper summarises the results of the third edition of the eHealth Knowledge Discovery (KD) challenge, hosted at the Iberian Language Evaluation Forum 2020. The eHealth-KD challenge proposes two computational tasks involving the identification of semantic entities and relations in natural language text, focusing on Spanish language health documents. In this edition, besides text extracted from medical sources, Wikipedia content was introduced into the corpus, and a novel transfer-learning evaluation scenario was designed that challenges participants to create systems that provide cross-domain generalisation. A total of eight teams participated with a variety of approaches including deep learning end-to-end systems as well as rule-based and knowledge-driven techniques. This paper analyses the most successful approaches and highlights the most interesting challenges for future research in this field. This research has been partially supported by the University of Alicante and University of Havana, the Generalitat Valenciana (Conselleria d’Educació, Investigació, Cultura i Esport) and the Spanish Government through the projects SIIA (PROMETEO/2018/089, PROMETEU/2018/089) and LIVING-LANG (RTI2018-094653-B-C22).
- Published
- 2020
16. Automatic Discovery of Heterogeneous Machine Learning Pipelines: An Application to Natural Language Processing
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estévez-Velarde, Suilan, Gutiérrez, Yoan, Montoyo, Andres, Almeida-Cruz, Yudivian, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estévez-Velarde, Suilan, Gutiérrez, Yoan, Montoyo, Andres, and Almeida-Cruz, Yudivian
- Abstract
This paper presents AutoGOAL, a system for automatic machine learning (AutoML) that uses heterogeneous techniques. In contrast with existing AutoML approaches, our contribution can automatically build machine learning pipelines that combine techniques and algorithms from different frameworks, including shallow classifiers, natural language processing tools, and neural networks. We define the heterogeneous AutoML optimization problem as the search for the best sequence of algorithms that transforms specific input data into the desired output. This provides a novel theoretical and practical approach to AutoML. Our proposal is experimentally evaluated in diverse machine learning problems and compared with alternative approaches, showing that it is competitive with other AutoML alternatives in standard benchmarks. Furthermore, it can be applied to novel scenarios, such as several NLP tasks, where existing alternatives cannot be directly deployed. The system is freely available and includes in-built compatibility with a large number of popular machine learning frameworks, which makes our approach useful for solving practical problems with relative ease and effort.
- Published
- 2020
17. Demo Application for the AutoGOAL Framework
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estévez-Velarde, Suilan, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Montoyo, Andres, Muñoz, Rafael, Almeida-Cruz, Yudivian, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Estévez-Velarde, Suilan, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Montoyo, Andres, Muñoz, Rafael, and Almeida-Cruz, Yudivian
- Abstract
This paper introduces a web demo that showcases the main characteristics of the AutoGOAL framework. AutoGOAL is a framework in Python for automatically finding the best way to solve a given task. It has been designed mainly for automatic machine learning (AutoML) but it can be used in any scenario where several possible strategies are available to solve a given computational task. In contrast with alternative frameworks, AutoGOAL can be applied seamlessly to Natural Language Processing as well as structured classification problems. This paper presents an overview of the framework’s design and experimental evaluation in several machine learning problems, including two recent NLP challenges. The accompanying software demo is available online and full source code is provided under the MIT open-source license.
- Published
- 2020
18. Knowledge Discovery in COVID-19 Research Literature
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Instituto Universitario de Investigación Informática, Piad-Morffis, Alejandro, Estévez-Velarde, Suilan, Estevanell-Valladares, Ernesto L., Gutiérrez, Yoan, Montoyo, Andres, Muñoz, Rafael, Almeida-Cruz, Yudivian, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Instituto Universitario de Investigación Informática, Piad-Morffis, Alejandro, Estévez-Velarde, Suilan, Estevanell-Valladares, Ernesto L., Gutiérrez, Yoan, Montoyo, Andres, Muñoz, Rafael, and Almeida-Cruz, Yudivian
- Abstract
This paper presents the preliminary results of an ongoing project that analyzes the growing body of scientific research published around the COVID-19 pandemic. In this research, a general-purpose semantic model is used to double annotate a batch of 500 sentences that were manually selected by the researchers from the CORD-19 corpus. Afterwards, a baseline text-mining pipeline is designed and evaluated via a large batch of 100,959 sentences. We present a qualitative analysis of the most interesting facts automatically extracted and highlight possible future lines of development. The preliminary results show that general-purpose semantic models are a useful tool for discovering fine-grained knowledge in large corpora of scientific documents.
- Published
- 2020
19. Overview of the eHealth Knowledge Discovery Challenge at IberLEF 2020
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Instituto Universitario de Investigación Informática, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Cañizares-Diaz, Hian, Estévez-Velarde, Suilan, Muñoz, Rafael, Montoyo, Andres, Almeida-Cruz, Yudivian, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Instituto Universitario de Investigación Informática, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Cañizares-Diaz, Hian, Estévez-Velarde, Suilan, Muñoz, Rafael, Montoyo, Andres, and Almeida-Cruz, Yudivian
- Abstract
This paper summarises the results of the third edition of the eHealth Knowledge Discovery (KD) challenge, hosted at the Iberian Language Evaluation Forum 2020. The eHealth-KD challenge proposes two computational tasks involving the identification of semantic entities and relations in natural language text, focusing on Spanish language health documents. In this edition, besides text extracted from medical sources, Wikipedia content was introduced into the corpus, and a novel transfer-learning evaluation scenario was designed that challenges participants to create systems that provide cross-domain generalisation. A total of eight teams participated with a variety of approaches including deep learning end-to-end systems as well as rule-based and knowledge-driven techniques. This paper analyses the most successful approaches and highlights the most interesting challenges for future research in this field.
- Published
- 2020
20. How Mathematical Approaches Could Help Decision-Making to Epidemic Control? The Successful Experience against COVID-19 in Cuba
- Author
-
Sanchez, Lizet, primary, Lorenzo-Luaces, Patricia, additional, Sebrango, Carlos, additional, Torres, Antonio, additional, Fonte, Claudia, additional, Crespo, Marelis, additional, Valdes, Jose E., additional, Baldoquin, Waldemar, additional, Fonte, Paula, additional, Almeida-Cruz, Yudivián, additional, Estévez-Velarde, Suilan, additional, Piad-Morffis, Alejandro, additional, Morales, Wilfredo, additional, Pérez, Nancy, additional, Araujo, Rafael, additional, del Carmen Pria, Maria, additional, Corral, Ariadna, additional, Noriega, Vivian, additional, Vidal, Maria, additional, Lage, Agustin, additional, Guinovart, Raul, additional, and Mas, Pedro, additional
- Published
- 2020
- Full Text
- View/download PDF
21. Análisis de Sistemas de Descubrimiento de Conocimiento en Documentos de Salud en el Taller TASS 2018
- Author
-
Piad-Morffis, Alejandro, Gutiérrez, Yoan, Estévez-Velarde, Suilan, Almeida-Cruz, Yudivian, Montoyo, Andres, Muñoz, Rafael, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
- Subjects
Descubrimiento de conocimiento ,Knowledge bases ,Knowledge discovery ,Natural language processing ,Procesamiento de lenguaje natural ,Machine learning ,Lenguajes y Sistemas Informáticos ,eHealth ,Bases de conocimiento ,Aprendizaje automático ,Salud electrónica - Abstract
This paper presents an analysis of Task 3 eHealth-KD challenge in the TASS 2018Workshop. The challenge consisted of the extraction of concepts, actions, and their corresponding semantic relations from health-related documents written in the Spanish language. The documents were manually annotated with a schema based on triples (Subject, Action, Target) and an additional set of semantic relations. Several research teams presented computational systems, obtaining relevant results in different subtasks. In this paper, the approaches performed by each team are analyzed and the most promising lines for future development are highlighted and discussed. Moreover, an in-depth analysis of the results is presented focusing on the main characteristics of each subtask. The overall eHealth-KD analysis has indicated that the Knowledge Discovery (KD) task, specifically focused on concrete domains and languages, represents a rich area for further research. In addition, this study considers that the fusion of machine learning {especially deep learning techniques{ and knowledge-based approaches will benefit the KD task. Este artículo presenta un análisis de la Tarea 3 eHealth-KD in el Taller TASS 2018. La tarea consistió en la extracción de conceptos, acciones, y sus correspondientes relaciones semánticas a partir de documentos sobre temas de salud en idioma español. Los documentos fueron manualmente anotados con un esquema basado en tripletas (Sujeto, Acción, Objeto) y un conjunto adicional de relaciones semánticas. Varios investigadores presentaron sistemas computacionales para la tarea, obteniendo resultados relevantes en las diferentes subtareas definidas. Los enfoques presentados por cada equipo son analizados en este artículo, subrayando las líneas de investigación futura más prometedoras. Además, se presenta un análisis profundo de los resultados, enfocado en las características de cada subtarea. El análisis general de la tarea eHealth-KD indica que las tareas de descubrimiento de conocimiento en idioma español para dominios específicos es un área fructífera de investigación. El progreso en este campo podría beneficiarse considerablemente de la fusión de técnicas de aprendizaje automático -especialmente aprendizaje profundo- con enfoques basados en conocimiento. This research has been partially supported by a Carolina Foundation grant in agreement with University of Alicante and University of Havana, sponsoring to Suilan Estevez-Velarde. Moreover, it has also been partially funded by both aforementioned universities and Generalitat Valenciana through the projects PROMETEU/2018/089, PINGVALUE3-18Y and SocialUniv 2.0(ENCARGOINTERNOOMNI-1).
- Published
- 2019
22. Analysis of eHealth knowledge discovery systems in the TASS 2018 Workshop
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Estévez-Velarde, Suilan, Almeida-Cruz, Yudivian, Montoyo, Andres, Muñoz, Rafael, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Piad-Morffis, Alejandro, Gutiérrez, Yoan, Estévez-Velarde, Suilan, Almeida-Cruz, Yudivian, Montoyo, Andres, and Muñoz, Rafael
- Abstract
This paper presents an analysis of Task 3 eHealth-KD challenge in the TASS 2018Workshop. The challenge consisted of the extraction of concepts, actions, and their corresponding semantic relations from health-related documents written in the Spanish language. The documents were manually annotated with a schema based on triples (Subject, Action, Target) and an additional set of semantic relations. Several research teams presented computational systems, obtaining relevant results in different subtasks. In this paper, the approaches performed by each team are analyzed and the most promising lines for future development are highlighted and discussed. Moreover, an in-depth analysis of the results is presented focusing on the main characteristics of each subtask. The overall eHealth-KD analysis has indicated that the Knowledge Discovery (KD) task, specifically focused on concrete domains and languages, represents a rich area for further research. In addition, this study considers that the fusion of machine learning {especially deep learning techniques{ and knowledge-based approaches will benefit the KD task., Este artículo presenta un análisis de la Tarea 3 eHealth-KD in el Taller TASS 2018. La tarea consistió en la extracción de conceptos, acciones, y sus correspondientes relaciones semánticas a partir de documentos sobre temas de salud en idioma español. Los documentos fueron manualmente anotados con un esquema basado en tripletas (Sujeto, Acción, Objeto) y un conjunto adicional de relaciones semánticas. Varios investigadores presentaron sistemas computacionales para la tarea, obteniendo resultados relevantes en las diferentes subtareas definidas. Los enfoques presentados por cada equipo son analizados en este artículo, subrayando las líneas de investigación futura más prometedoras. Además, se presenta un análisis profundo de los resultados, enfocado en las características de cada subtarea. El análisis general de la tarea eHealth-KD indica que las tareas de descubrimiento de conocimiento en idioma español para dominios específicos es un área fructífera de investigación. El progreso en este campo podría beneficiarse considerablemente de la fusión de técnicas de aprendizaje automático -especialmente aprendizaje profundo- con enfoques basados en conocimiento.
- Published
- 2019
23. Overview of TASS 2018: Opinions, Health and Emotions
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Martínez Cámara, Eugenio, Almeida-Cruz, Yudivian, Díaz Galiano, Manuel Carlos, Estévez-Velarde, Suilan, García Cumbreras, Miguel Ángel, García Vega, Manuel, Gutiérrez, Yoan, Montejo Ráez, Arturo, Montoyo, Andres, Muñoz, Rafael, Piad-Morffis, Alejandro, Villena Román, Julio, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Martínez Cámara, Eugenio, Almeida-Cruz, Yudivian, Díaz Galiano, Manuel Carlos, Estévez-Velarde, Suilan, García Cumbreras, Miguel Ángel, García Vega, Manuel, Gutiérrez, Yoan, Montejo Ráez, Arturo, Montoyo, Andres, Muñoz, Rafael, Piad-Morffis, Alejandro, and Villena Román, Julio
- Abstract
This is an overview of the Workshop on Semantic Analysis at the SEPLN congress held in Sevilla, Spain, in September 2018. This forum proposes to participants four different semantic tasks on texts written in Spanish. Task 1 focuses on polarity classification; Task 2 encourages the development of aspect-based polarity classification systems; Task 3 provides a scenario for discovering knowledge from eHealth documents; finally, Task 4 is about automatic classification of news articles according to safety. The former two tasks are novel in this TASS's edition. We detail the approaches and the results of the submitted systems of the different groups in each task., Este artículo ofrece un resumen sobre el Taller de Análisis Semántico en la SEPLN (TASS) celebrado en Sevilla, España, en septiembre de 2018. Este foro propone a los participantes cuatro tareas diferentes de análisis semántico sobre textos en español. La Tarea 1 se centra en la clasificación de la polaridad; la Tarea 2 anima al desarrollo de sistemas de polaridad orientados a aspectos; la Tarea 3 consiste en descubrir conocimiento en documentos sobre salud; finalmente, la Tarea 4 propone la clasificación automática de noticias periodísticas según un nivel de seguridad. Las dos últimas tareas son nuevas en esta edición. Se ofrece una síntesis de los sistemas y los resultados aportados por los distintos equipos participantes, así como una discusión sobre los mismos.
- Published
- 2018
24. Generación procedural de ciudades: un enfoque jerárquico
- Author
-
Consuegra Ayala, Juan Pablo, Piad Morffis, Alejandro, Estévez Velarde, Suilan, Leonard Méndez, Ludwig, and Katrib Mora, Miguel
- Subjects
Realidad virtual ,Videojuegos - Abstract
La generación procedural de ciudades ha sido tema de un gran número de investigaciones en los últimos años. El creciente nivel de detalle que exigen los contenidos en las aplicaciones de realidad virtual lo demanda. En este trabajo se propone un nuevo enfoque para la generación procedural de ciudades. Para ello se describe una forma de representar el contenido a generar y se propone una estrategia de generación acorde a dicha representación.
- Published
- 2017
25. Analysis of eHealth knowledge discovery systems in the TASS 2018 Workshop.
- Author
-
Piad-Morffis, Alejandro, Gutiérrez, Yoan, Estévez-Velarde, Suilan, Almeida-Cruz, Yudivián, Montoyo, Andrés, and Muñoz, Rafael
- Subjects
DEEP learning ,NATURAL language processing ,MACHINE learning ,TASK analysis ,SPANISH language - Abstract
Copyright of Procesamiento del Lenguaje Natural is the property of Sociedad Espanola para el Procesamiento del Lenguaje Natural and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2019
- Full Text
- View/download PDF
26. Differential evolution with thresheld convergence
- Author
-
Bolufé-Röhler, Antonio, Estévez-Velarde, Suilan, Piad-Morffis, Alejandro, Chen, Stephen, Montgomery, James, Bolufé-Röhler, Antonio, Estévez-Velarde, Suilan, Piad-Morffis, Alejandro, Chen, Stephen, and Montgomery, James
- Abstract
During the search process of differential evolution (DE), each new solution may represent a new more promising region of the search space (exploration) or a better solution within the current region (exploitation). This concurrent exploitation can interfere with exploration since the identification of a new more promising region depends on finding a (random) solution in that region which is better than its target solution. Ideally, every sampled solution will have the same relative fitness with respect to its nearby local optimum – finding the best region to exploit then becomes the problem of finding the best random solution. However, differential evolution is characterized by an initial period of exploration followed by rapid convergence. Once the population starts converging, the difference vectors become shorter, more exploitation is performed, and an accelerating convergence occurs. This rapid convergence can occur well before the algorithm’s budget of function evaluations is exhausted; that is, the algorithm can converge prematurely. In thresheld convergence, early exploitation is “held” back by a threshold function, allowing a longer exploration phase. This paper presents a new adaptive thresheld convergence mechanism which helps DE achieve large performance improvements in multi-modal search spaces.
- Published
- 2013
27. EVALUACIÓN DE ALGORITMOS DE CLASIFICACION SUPERVISADA PARA EL MINADO DE OPINIÓN EN TWITTER.
- Author
-
Estévez-Velarde, Suilan and Almeida Cruz, Yudivián
- Subjects
- *
CLASSIFICATION algorithms , *MACHINE learning , *ARTIFICIAL intelligence , *MACHINE theory , *SENTIMENT analysis - Abstract
This paper proposes a comprehensive evaluation of supervised classification algorithms without semantic information for opinion mining on Twitter. The evaluation will assess the potential of this approach to tackle the given problem. Also, as result of evaluating, the impact of different variants of the text preprocessing is assessed, as well as different alternatives of dimension reduction techniques in the problem solution. Finally, the results obtained in the experiments offer evidence to direct the use of supervised classification to classify opinions and its valence in a domain of short messages such as Twitter. [ABSTRACT FROM AUTHOR]
- Published
- 2015
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.