29 results on '"Muñoz-Guillena, Rafael"'
Search Results
2. A systemic and cybernetic perspective on causality, big data and social networks in tourism
- Author
-
Lloret-Climent, Miguel, Montoyo, Andrés, Gutierrez, Yoan, Muñoz Guillena, Rafael, and Alonso, Kristian
- Published
- 2019
- Full Text
- View/download PDF
3. Demo Application for the AutoGOAL Framework
- Author
-
Estevez-Velarde, Suilan, primary, Piad-Morffis, Alejandro, additional, Gutiérrez, Yoan, additional, Montoyo, Andres, additional, Muñoz-Guillena, Rafael, additional, and Almeida Cruz, Yudivián, additional
- Published
- 2020
- Full Text
- View/download PDF
4. ATTOS: Trend Analysis and Thematic through Opinions and Sentiments
- Author
-
Ureña López, L. Alfonso, Muñoz Guillena, Rafael, Troyano Jiménez, José Antonio, Martín Valdivia, M. Teresa, Universidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Sevilla. TIC-134: Sistemas Informáticos, and Ministerio de Economía y Competitividad (MINECO). España
- Subjects
Tecnologías del lenguaje humano ,Análisis de opiniones y sentimientos ,Clasificación de opiniones ,Natural language processing ,Information Retrieval ,Opinion and Sentiments Analysis ,Opinion Classification ,Procesamiento del lenguaje natural ,Recuperación de la información ,Human Language Technology - Abstract
El proyecto ATTOS centra su actividad en el estudio y desarrollo de técnicas de análisis de opiniones, enfocado a proporcionar toda la información necesaria para que una empresa o una institución pueda tomar decisiones estratégicas en función a la imagen que la sociedad tiene sobre esa empresa, producto o servicio. El objetivo último del proyecto es la interpretación automática de estas opiniones, posibilitando así su posterior explotación. Para ello se estudian parámetros tales como la intensidad de la opinión, ubicación geográfica y perfil de usuario, entre otros factores, para facilitar la toma de decisiones. El objetivo general del proyecto se centra en el estudio, desarrollo y experimentación de técnicas, recursos y sistemas basados en Tecnologías del Lenguaje Humano (TLH), para conformar una plataforma de monitorización de la Web 2.0 que genere información sobre tendencias de opinión relacionadas con un tema. The ATTOS project will be focused on the study and development of Sentiment Analysis techniques. Thanks to such techniques and resources, companies, but also institutions will be better understood which is the public opinion on them and thus will be able to develop their strategies according to their purposes. The final aim of the project is the automatic interpretation of such opinions according to different variables: opinion, intensity, geographical area, user profile, to support the decision process. The main objective of the project is the study, development and evaluation of techniques, resources and systems based on Human Language Technologies to build up a monitoring platform of the Web 2.0 that generates information on opinion trends related with a topic. Ministerio de Economía y Competitividad TIN2012-38536-C03-01 Ministerio de Economía y Competitividad TIN2012-38536-C03-02 Ministerio de Economía y Competitividad TIN2012-38536-C03-03 Ministerio de Economía y Competitividad TIN2011-13070-E
- Published
- 2014
5. Informe, desde el punto de vista de la accesibilidad y de la igualdad, sobre los espacios del Campus de San Vicente del Raspeig de la Universidad de Alicante
- Author
-
Fontcuberta Rubio, David, Gutiérrez Mozo, María Elia, Muñoz Guillena, Rafael, Universidad de Alicante. Departamento de Expresión Gráfica y Cartografía, and Metrópoli, Arquitectura y su Patrimonio (MAP)
- Subjects
Alicante ,Universidad ,Proyecto ,Accesible ,Igualitario ,Campus ,Composición Arquitectónica - Abstract
Memoria del Proyecto Campus Accesible, Campus Igualitario de la Universidad de Alicante del año 2014. Vicerrectorado de Campus y Sostenibilidad (Secretariado de Desarrollo de Campus), Vicerrectorado de Estudiantes (Centro de Apoyo al Estudiante) y Unidad de Igualdad. COLABORADORES: María José Rodríguez Jaume, María José Torregrosa Vélez, Irene Sentana Gadea, Juan David Sempere Souvannavong, Cristina Caro Gallego, Ana Moles Segovia, Miguel Martín Carballo, Silvia Spairani Berio, Ana Gilsanz Díaz, Raquel Pérez del Hoyo, Laura Soler Azorín y Asociación Alicante Accesible. Vicerrectorado de Campus y Sostenibilidad de la Universidad de Alicante
- Published
- 2014
6. Extractive text summarization: can we use the same techniques for any text?
- Author
-
Vodolazova, Tatiana, Lloret, Elena, Muñoz Guillena, Rafael, Palomar Sanz, Manuel, Procesamiento del Lenguaje y Sistemas de Información (GPLSI), and Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
- Subjects
Textual entailment ,Text summarization ,Lenguajes y Sistemas Informáticos ,Anaphora resolution - Abstract
In this paper we address two issues. The first one analyzes whether the performance of a text summarization method depends on the topic of a document. The second one is concerned with how certain linguistic properties of a text may affect the performance of a number of automatic text summarization methods. For this we consider semantic analysis methods, such as textual entailment and anaphora resolution, and we study how they are related to proper noun, pronoun and noun ratios calculated over original documents that are grouped into related topics. Given the obtained results, we can conclude that although our first hypothesis is not supported, since it has been found no evident relationship between the topic of a document and the performance of the methods employed, adapting summarization systems to the linguistic properties of input documents benefits the process of summarization. This research work has been partially funded by the European Commission under the Seventh (FP7 - 2007-2013) Framework Programme for Research and Technological Development through the FIRST project (FP7-287607); the Spanish Government through the project TEXTMESS 2.0 (TIN2009-13391-C04), ”Análisis de Tendencias Mediante Técnicas de Opinión Semántica” (TIN2012-38536-C03-03 ) and “Técnicas de Deconstrucción en la Tecnologías del Lenguaje Humano” (TIN2012-31224); and by the Valencian Government through the project PROMETEO (PROMETEO/2009/199).
- Published
- 2013
7. Aplicación de la semántica multidimensional, alineamiento léxico-semántico y distancias léxicas al mejoramiento de tareas intermedias del PLN
- Author
-
Muñoz Guillena, Rafael, Gutiérrez Vázquez, Yoan, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Fernández Orquín, Antonio, Muñoz Guillena, Rafael, Gutiérrez Vázquez, Yoan, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Fernández Orquín, Antonio
- Published
- 2014
8. Una aproximación léxico-semántica para el mapeado automático de medicamentos y su aplicación al enriquecimiento de ontologías farmacoterapéuticas
- Author
-
Romá Ferri, María Teresa, Muñoz Guillena, Rafael, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Cruañes Vilas, Jorge, Romá Ferri, María Teresa, Muñoz Guillena, Rafael, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Cruañes Vilas, Jorge
- Abstract
Recientemente ha entrado en vigor en España una nueva legislación que afecta a la información existente en los medicamentos comercializados en este país. Ésta obliga a la inclusión de información de correspondencia respecto a la terminología internacional multilingüe SNOMED-CT. Este proceso es realizado actualmente de forma manual. Este es el punto de partida de este trabajo. Por tanto, el primer objetivo de esta tesis es obtener un método capaz de realizar estas correspondencias (mapeados) de forma automática. Para ello se hará uso de SNOMED-CT como terminología destino de los mapeados y, como origen, los medicamentos comercializados en España existentes en la ontología OntoFIS. Esta ontología ha sido poblada de forma semi-automática a partir de la base de datos oficial del Ministerio de Sanidad Español DIGITALIS. Usar una ontología en lugar de directamente la base de datos aporta ciertos beneficios, como la existencia de conocimiento semántico explicitado (relaciones semánticas), que supondrán una ayuda en el propio proceso de mapeado y, posteriormente, en otros procesos de marcado, extracción de información o clasificación. Para poder alcanzar este objetivo, sin embargo, es necesario equiparar los niveles de especificidad (también conocida como granularidad) de ambos recursos (OntoFIS y SNOMED-CT), ya que no es posible mapear dos recursos con diferentes granularidades. Finalmente, tras haber logrado establecer los mapeados entre ambas terminologías, el último objetivo de la tesis será el de utilizar dichos mapeados para ampliar semánticamente la ontología OntoFIS. Para la consecución de estos tres objetivos, y tras haber estudiado los trabajos existentes en el domino de salud en castellano e inglés, se ha optado por utilizar técnicas de Procesamiento del Lenguaje Natural (PLN), combinándolo con un sistema basado en patrones. Partiendo de las etiquetas del nombre de los medicamentos comercializados en España (nombres de especialidad) junto con las especificaciones
- Published
- 2014
9. ATTOS: análisis de Tendencias y Temáticas a través de Opiniones y Sentimientos
- Author
-
Universidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Sevilla. TIC-134: Sistemas Informáticos, Ministerio de Economía y Competitividad (MINECO). España, Ureña López, L. Alfonso, Muñoz Guillena, Rafael, Troyano Jiménez, José Antonio, Martín Valdivia, M. Teresa, Universidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Sevilla. TIC-134: Sistemas Informáticos, Ministerio de Economía y Competitividad (MINECO). España, Ureña López, L. Alfonso, Muñoz Guillena, Rafael, Troyano Jiménez, José Antonio, and Martín Valdivia, M. Teresa
- Abstract
El proyecto ATTOS centra su actividad en el estudio y desarrollo de técnicas de análisis de opiniones, enfocado a proporcionar toda la información necesaria para que una empresa o una institución pueda tomar decisiones estratégicas en función a la imagen que la sociedad tiene sobre esa empresa, producto o servicio. El objetivo último del proyecto es la interpretación automática de estas opiniones, posibilitando así su posterior explotación. Para ello se estudian parámetros tales como la intensidad de la opinión, ubicación geográfica y perfil de usuario, entre otros factores, para facilitar la toma de decisiones. El objetivo general del proyecto se centra en el estudio, desarrollo y experimentación de técnicas, recursos y sistemas basados en Tecnologías del Lenguaje Humano (TLH), para conformar una plataforma de monitorización de la Web 2.0 que genere información sobre tendencias de opinión relacionadas con un tema., The ATTOS project will be focused on the study and development of Sentiment Analysis techniques. Thanks to such techniques and resources, companies, but also institutions will be better understood which is the public opinion on them and thus will be able to develop their strategies according to their purposes. The final aim of the project is the automatic interpretation of such opinions according to different variables: opinion, intensity, geographical area, user profile, to support the decision process. The main objective of the project is the study, development and evaluation of techniques, resources and systems based on Human Language Technologies to build up a monitoring platform of the Web 2.0 that generates information on opinion trends related with a topic.
- Published
- 2014
10. Incorporating textual entailment recognition in single- and multi-document summarization systems
- Author
-
Lloret, Elena, Ferrández Escámez, Óscar, Muñoz Guillena, Rafael, and Palomar Sanz, Manuel
- Subjects
Textual entailment ,Multi-document ,Implicación textual ,Automatic summarization ,Multidocumento ,Word-frequency ,Frecuencia de palabras ,Resumen automático - Abstract
Este artículo presenta un estudio preliminar sobre la influencia de la implicación textual en tareas de generación automática de resúmenes de textos. Se proponen dos aproximaciones para producir resúmenes a partir de uno o varios documentos de entrada. La primera de ellas se basa únicamente en la frecuencia de las palabras para determinar las frases más relevantes del texto, mientras que la segunda aproximación combina esta técnica con el reconocimiento de la implicación textual para reducir el número de frases del documento de entrada. Los resultados iniciales obtenidos presentan una mejora del 5.85 % para monodocumento y del 6.80 % para multidocumento cuando se incorpora el reconocimiento de la implicación textual. This paper presents a preliminary study of the usefulness of applying textual entailment recognition in text summarization tasks. Two different approaches are proposed. The first one relies on the word’s frequency in order to select the most relevant sentences to include in the final summary, whereas the second one combines textual entailment recognition together with the aforementioned approach so that we can reduce the size of the original text or texts first. Results show that this combination has been appropriate, obtaining an increase of 5.85 % for single-document and of 6.80 % for multi-document when textual entailment and the frequency of words are applied together. Esta investigación ha sido financiada por el proyecto TEXT-MESS (TIN2006-15265-C06-01) del Ministerio de Educación y Ciencia y parcialmente financiada bajo el proyecto QALL-ME (FP6-IST-033860), dentro del Sexto Programa Marco de Investigación de la Unión Europea.
- Published
- 2008
11. DLSITE-1: lexical analysis for solving textual entailment recognition
- Author
-
Ferrández Escámez, Óscar, Micol Ponce, Daniel, Muñoz Guillena, Rafael, Palomar Sanz, Manuel, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Procesamiento del Lenguaje Natural y Sistemas de Información
- Subjects
Textual entailment ,Procesamiento del Lenguaje Natural ,Lexical analysis ,Paraphrasing - Abstract
This paper discusses the recognition of textual entailment in a text-hypothesis pair by applying a wide variety of lexical measures. We consider that the entailment phenomenon can be tackled from three general levels: lexical, syntactic and semantic. The main goals of this research are to deal with this phenomenon from a lexical point of view, and achieve high results considering only such kind of knowledge. To accomplish this, the information provided by the lexical measures is used as a set of features for a Support Vector Machine which will decide if the entailment relation is produced. A study of the most relevant features and a comparison with the best state-of-the-art textual entailment systems is exposed throughout the paper. Finally, the system has been evaluated using the Second PASCAL Recognising Textual Entailment Challenge data and evaluation methodology, obtaining an accuracy rate of 61.88%. QALL-ME consortium, 6º Programa Marco, Unión Europea, referencia del proyecto FP6-IST-033860. Gobierno de España, proyecto CICyT número TIN2006-1526-C06-01.
- Published
- 2007
12. Técnicas léxico-sintácticas para el reconocimiento de implicación textual
- Author
-
Ferrández Escámez, Óscar, Micol Ponce, Daniel, Muñoz Guillena, Rafael, and Palomar Sanz, Manuel
- Subjects
Textual entailment ,Syntactic trees ,Implicación textual ,Similitud léxica ,Arboles sintácticos ,Lexical similarity - Abstract
Este artículo presenta dos aproximaciones para el reconocimiento del fenómeno de implicación textual, basadas principalmente en similitudes léxicas y árboles sintácticos. Dichas aproximaciones son fácilmente portables al reconocimiento de implicaciones textuales en diferentes idiomas. Se presentan resultados individuales para cada aproximación y además, se propone una votación simple entre estos métodos y nuestro sistema previo (presentado en Second PASCAL Recognising Textual Entailment), alcanzando una precisión del 63 %. This paper covers the recognition of textual entailment by means of different approaches based on lexical similarities and syntactic trees. These approaches are easily portable to other languages. We present the achieved results for each individual approach and we propose a simple voting strategy between these approaches and our previous system (presented in Second PASCAL Recognising Textual Entailment), obtaining an accuracy rate of 63 %. Esta investigación ha sido parcialmente financiada bajo los proyectos QALL-ME, dentro del Sexto Programa Marco de Investigación de la Unión Europea con referencia FP6-IST-033860, y CICyT número TIN2006-15265-C06-01.
- Published
- 2007
13. Ita-TERSEO
- Author
-
Saquete Boró, Estela, Martínez Barco, Patricio, Muñoz Guillena, Rafael, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Procesamiento del Lenguaje Natural y Sistemas de Información
- Subjects
Recognition ,Normalization ,Automatic extension ,Lenguajes y Sistemas Informáticos - Abstract
In this paper, we describe the process to extend TERSEO system to Italian using an automatic porting to this new language, as it was performed to English. In questo report viene descritto il processo in base al quale TERSEO, un sistema knowledge-based per il riconoscimento e la normalizzazione di espressioni temporali, originariamente sviluppato per lo spagnolo, è stato esteso all’italiano. Work partially supported by the project QALL-ME (FP6-IST-033860), and project TEXT-MESS (TIN-2006-15265-C06-01).
- Published
- 2007
14. Reconocimiento temporal para el italiano combinando técnicas de aprendizaje automático y adquisición automática de conocimiento
- Author
-
Saquete Boró, Estela, Ferrández Escámez, Óscar, Martínez Barco, Patricio, and Muñoz Guillena, Rafael
- Subjects
Información temporal ,Temporal expression recognition ,Reconocimiento de expresiones temporales ,Machine learning ,Temporal information ,Adquisición automática del conocimiento ,Aprendizaje automático ,Automatic acquisition of knowledge - Abstract
Este artículo presenta la extensión automática del sistema TERSEO a otras lenguas combinada con el uso de técnicas basadas en Aprendizaje Automático (AA). En concreto, en este artículo se trabaja en el reconocimiento de expresiones temporales para el italiano y se han probado dos técnicas diferentes de AA: un modelo de Máxima Entropía y modelos ocultos de Markov. Cada sistema ha sido evaluado tanto de manera independiente como de manera combinada con la finalidad de analizar si el sistema combinado mejora los resultados de los sistemas independientes sin incrementar el número de expresiones erróneas en el mismo porcentaje. El sistema TERSEO fue combinado previamente con técnicas de AA para el inglés, obteniendo en ese caso buenos resultados. En este artículo, la combinación del reconocimiento de TERSEO con el reconocimiento del sistema de AA ha sido evaluada para el italiano. La combinación de TERSEO con diferentes técnicas de AA ha sido evaluada obteniendo resultados satisfactorios, sobre todo, teniendo en cuenta que la extensión automática de TERSEO al italiano no ha sido supervisada manualmente y el proceso se ha realizado de manera completamente automática. This paper presents the automatic extension of TERSEO system to other languages combined with the use of Machine Learning (ML) techniques. In particular, in this paper, Italian temporal expression recognition is treated and two different ML techniques have been proven: Maximum Entropy Model and Hidden Markov Model. Every system has been evaluated independently and combined afterwards in order to analyze if the system is improving the results in the combination without increasing the number of erroneous expressions in the same percentage. TERSEO system was previously combined with ML techniques for English obtaining good results. In this paper, TERSEO plus ML has been evaluated for Italian. When TERSEO system is combined with different ML techniques, the results are quite successful, taking into account that the automatic extension of TERSEO system for Italian has not been manually supervised and the whole process has been automatically performed. Esta investigación ha sido parcialmente financiada bajo el proyecto CICyT número TIC2003-07158-C04-01.
- Published
- 2006
15. NERUA: sistema de detección y clasificación de entidades utilizando aprendizaje automático
- Author
-
Ferrández Escámez, Óscar, Kozareva, Zornitsa Petrova, Montoyo Guijarro, Andrés, and Muñoz Guillena, Rafael
- Subjects
Named entity recognition ,Reconocimiento de entidades ,Independiente del lenguaje ,Machine learning ,Language independent ,Aprendizaje automático - Abstract
Este artículo presenta un sistema de reconocimiento de entidades para Español combinando diferentes algoritmos de aprendizaje. Se propone una detección de entidades independiente del lenguaje y se estudia la influencia del tamaño del corpus de entrenamiento en los resultados. NERUA obtuvo 92.96% f-score en la detección y 78.59% en la clasificación de entidades. In this paper we present a Named Entity Recognition system developed for Spanish by combining different machine learning techniques. A language independent approach for NE detection and evaluation of the influence of the training corpus size have been made. NERUA obtained 92.96% f-score for detection and 78.59% for classification. Esta investigación ha sido parcialmente financiada bajo los proyectos CICyT número TIC2003-07158-C04-01 y PROFIT número FIT-340100-2004-14 y por la Generalitat Valenciana bajo los proyectos GV04B-276 y GV04B-268.
- Published
- 2005
16. A proposal of algorithm for solving definite descriptions through dialogue structure
- Author
-
Navarro Colorado, Francisco de Borja, Martínez Barco, Patricio, Muñoz Guillena, Rafael, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
- Subjects
Discurso ,Text structure ,Lenguajes y Sistemas Informáticos ,Resolución de la anáfora ,Estructura del texto ,Discourse ,Anaphora resolution - Abstract
En este trabajo proponemos un algoritmo para la resolución de las descripciones definidas en español a través de la estructura del diálogo, mediante la definición de un espacio de accesibilidad anafórico. Este algoritmo está basado en la hipótesis de que la resolución de la anáfora está relacionada con la estructura del diálogo. Así, la resolución de la anáfora mejora si se especifica un espacio de accesibilidad para cada tipo descripción definida según la estructura del diálogo. La utilización de este espacio de accesibilidad anafóico reduce tanto el tiempo de procesamiento como la posibilidad de obtener un antecedente erróneo. Además, la definición de este espacio de accesibilidad depende únicamente de la propia estructura textual del diálogo. In this paper we present a proposal of algorithm for definite description resolution through the structure of dialogue defining an anaphoric accessibility space in Spanish. This algorithm is based on the theoretical hypothesis that anaphora resolution and the dialogue structure are related. The definite description resolution improve if we can specify the accessibility space of each definite description with the dialogue structure. This anaphoric accessibility space is built with a series of open sequences where the coreference is likely used. The use of this anaphoric accessibility space reduce both the computational time and the possibility of obtaining an incorrect antecedent in the resolution process. Moreover, the definition of this anaphoric accessibility space based on dialogue structure only depends on the self structure. This paper has been supported by the Spanish Government (MCYT) under grant TIC2000-0664-C02-01/02.
- Published
- 2003
17. Event ordering through temporal expression resolution
- Author
-
Saquete Boró, Estela, Muñoz Guillena, Rafael, Martínez Barco, Patricio, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
- Subjects
Event ordering ,TERSEO ,Lenguajes y Sistemas Informáticos ,Temporal expression resolution ,Question answering - Abstract
In this paper a multilingual method for event ordering based on temporal expression resolution is presented. This method has been implemented through the TERSEO system which consists of three main units: temporal expression recognizing, resolution of the coreference introduced by these expressions, and event ordering. By means of this system, chronological information related to events can be extracted from documental databases. This information is automatically added to the documental database in order to allow its use by question answering systems in those cases referring to temporality. The system has been evaluated obtaining results of 91 % precision and 71 % recall. For this, a blind evaluation process has been developed guaranteing a reliable annotation process that was measured through the kappa factor. This paper has been supported by the Spanish government, projects FIT-150500-2002-244 and FIT-150500-2002-416.
- Published
- 2003
18. X-Not@rial : sistema de recuperación y extracción de información notarial
- Author
-
Muñoz Guillena, Rafael, Llopis Pascual, Fernando, Izquierdo Beviá, Rubén, and Calle Bellido, María del Carmen
- Subjects
Extracción de información ,Named entity recognition ,Reconocimiento de entidades ,Information extraction ,Information retrieval ,Recuperación de información - Abstract
El sistema X-Not@rial realiza tareas de recuperación y extracción de información. Las tareas de extracción de información se realizan en el dominio notarial y más concretamente en la de las escrituras de compraventa. El sistema selecciona los documentos relacionados con escrituras de compraventa de una colección de textos heterogénea y posteriormente aplica las técnicas de extracción de información para identificar la información relevante. X-Not@rial system solves information retrieval and information extraction tasks. The information extraction tasks have been developed in deed domain. The system selects a subset of document related to deed documents. After thats, the information extraction techniques selects the relevant information.
- Published
- 2003
19. Tratamiento y resolución de las descripciones definidas y su aplicación en sistemas de extracción de información
- Author
-
Muñoz Guillena, Rafael
- Subjects
Extracción de información ,Definite description ,Information extraction ,Fenómenos lingüísticos ,Resolución de la anáfora ,Descripciones definidas ,Linguistic phenomena ,Anaphora resolution - Abstract
Director de la tesis: Manuel Palomar Sanz Este trabajo presenta un sistema de resolución de las descripciones definidas en español. Este sistema está basado en la agrupación semántica de los sintagmas nominales que han aparecido previamente en el texto a la expresión anafórica (descripción definida) utilizando la ontología de EuroWordNet. Para la resolución de las referencias producidas se utilizan diversas fuentes de información como son la información léxica, sintáctica y semántica. Además, se presenta un estudio de la influencia de su resolución en los sistemas de extracción de información. This work presents a definite description resolution system in Spanish. This system is based on the clustering of previous noun phrases to the anaphoric expression (definite description) using the EuroWordNet's ontology. To solve the references produced by definite description different sources are used: lexical, syntactic and semantic information. Moreover, we also present a study of the definite description resolution influence in information extraction systems. Esta investigación ha sido parcialmente financiada por la CICYT a través del proyecto TIC2000-0664-C02-01/02.
- Published
- 2002
20. Propuesta de un espacio de accesibilidad anafórica estructural para textos HTML
- Author
-
Navarro Colorado, Francisco de Borja, Martínez Barco, Patricio, and Muñoz Guillena, Rafael
- Subjects
HTML ,Espacio de accesibilidad anafórica ,Estructura del discurso ,Resolución de la anáfora - Abstract
En este artículo se presenta un estudio sobre el espacio de accesibilidad anafórico que puede extraerse de la estructura generada por la publicación electrónica de documentos a través del formalismo HTML. Esta propuesta se basa en la dependencia existente entre la resolución de la anáfora y la estructura del discurso. Aprovechando las etiquetas de marca proporcionadas por HTML, proponemos una especificación del espacio de accesibilidad para cada tipo de expresión anafórica. A diferencia de otras propuestas de espacios de accesibilidad, nuestra propuesta no hace una definición arbitraria basada en unidades sintácticas (oraciones) sino en unidades de la estructura del discurso. Ello permite establecer un criterio consistente basado en información lingüística independiente del corpus. Este trabajo ha sido subvencionado por la CICYT (Comisión Interministerial de Ciencia y Tecnología) bajo el proyecto TIC2000-0664-C02-01/02.
- Published
- 2001
21. Aplicación de técnicas de extracción de información en bibliotecas digitales
- Author
-
Bia Platas, Alejandro and Muñoz Guillena, Rafael
- Subjects
Extracción de información ,HTML ,Bibliotecas digitales - Abstract
Con frecuencia, las Bibliotecas Digitales tienen la necesidad de extraer información a partir de documentos pobremente marcados para almacenarla en bases de datos o crear nuevos documentos hipertexto con un marcado altamente estructurado. En este trabajo, abordaremos el problema de extraer información bibliográfica a partir de informes literarios en formato HTML para alimentar una base de datos de publicaciones gallegas de una Biblioteca Digital para ser consultada a través de Internet. Para este fin se ha utilizado con éxito una metodología que aprovecha la información contenida en las marcas HTML y que a su vez aplica técnicas de Procesamiento del Lenguaje Natural (PLN).
- Published
- 2000
22. PHORA: a system to solve the anaphora in Spanish
- Author
-
Palomar Sanz, Manuel, Saiz Noeda, Maximiliano, Muñoz Guillena, Rafael, Suárez Cueto, Armando, Martínez Barco, Patricio, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
- Subjects
Lenguajes y Sistemas Informáticos ,LFG grammar and parsing ,EuroWordNet ,Anaphora resolution ,Semantics - Abstract
In this paper we present a whole Natural Language Processing (NLP) system for Spanish. The core of this system is the parser, which uses the grammatical formalism Lexical-Functional Grammars (LFG). Another important component of this system is the anaphora resolution module. To solve the anaphora, this module contains a method based on linguistic information (lexical, morphological, syntactic and semantic), structural information (anaphoric accessibility space in which the anaphor obtains the antecedent) and statistical information. This method is based on constraints and preferences and solves pronouns and definite descriptions. Moreover, this system fits dialogue and non-dialogue discourse features. The anaphora resolution module uses several resources, such as a lexical database (Spanish WordNet) to provide semantic information and a POS tagger providing the part of speech for each word and its root to make this resolution process easier.
- Published
- 2000
23. Evaluation of pronoun resolution algorithm for Spanish dialogues
- Author
-
Martínez Barco, Patricio, Muñoz Guillena, Rafael, Azzam, Saliha, Palomar Sanz, Manuel, Ferrández Rodríguez, Antonio, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
- Subjects
Spanish dialogues ,Lenguajes y Sistemas Informáticos ,Pronominal anaphora ,Anaphora resolution - Abstract
In this paper, we present an algorithm for anaphora resolution in Spanish dialogues and an evaluation of the algorithm for pronominal anaphora. The proposed algorithm uses both linguistic information and the structure of the dialogue to find the antecedent of the anaphors. The system has been evaluated on ten dialogues. This paper has been supported by the Comisión Interministerial de Ciencia y Tecnología with project number TIC97-0671-C02-02.
- Published
- 1999
24. Método para la resolución de correferencias de sintagmas nominales definidos incluyendo alias y acrónimos en el sistema de extracción de información EXIT
- Author
-
Muñoz Guillena, Rafael, Martínez Barco, Patricio, and Ferrández Rodríguez, Antonio
- Subjects
Extracción de información ,Alias ,Sintagmas nominales definidos ,Resolución de correferencias ,Acrónimos - Abstract
En este trabajo se presenta un algoritmo para la resolución de las correferencias del tipo identidad producidas por sintagmas nominales definidos incluyendo acrónimos y alias en textos en castellano. Este algoritmo se aplica a un sistema de extracción de información, EXIT Llopis et al. (1998), que trabaja en un dominio restringido como es el de las escrituras notariales de compraventa. Dicho algoritmo no sólo resuelve los sintagmas nominales definidos que tienen el mismo núcleo o una relación de sinonimia con el posible antecedente, tal como otros autores han hecho hasta ahora Kameyama (1997), Vieira (1999), sino también aquellos cuyo núcleo se relaciona semánticamente con el verbo de la frase en la que aparecen los posibles antecedentes. Este artículo ha sido subvencionado por la Comisión Interministerial de Ciencia y Tecnología con el proyecto número TIC97-0671-C02-02.
- Published
- 1999
25. Resolución de información temporal y su aplicación a la búsqueda de respuestas
- Author
-
Martínez Barco, Patricio, Muñoz Guillena, Rafael, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Saquete Boró, Estela, Martínez Barco, Patricio, Muñoz Guillena, Rafael, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Saquete Boró, Estela
- Published
- 2005
26. ATTOS: Análisis de Tendencias y Temáticas a través de Opiniones y Sentimientos.
- Author
-
Ureña López, L. Alfonso, Muñoz Guillena, Rafael, Troyano Jiménez, José A., and Martín Valdivia, M. A. Teresa
- Abstract
Copyright of Procesamiento del Lenguaje Natural is the property of Sociedad Espanola para el Procesamiento del Lenguaje Natural and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2014
27. Una aproximación léxico-semántica para el mapeado automático de medicamentos y su aplicación al enriquecimiento de ontologías farmacoterapéuticas
- Author
-
Cruañes Vilas, Jorge, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Romá Ferri, María Teresa, and Muñoz Guillena, Rafael
- Subjects
Ontología ,Lenguajes y Sistemas Informáticos ,Medicamentos ,Farmacoterapéutica ,Mapeado ,Enriquecimiento - Abstract
Recientemente ha entrado en vigor en España una nueva legislación que afecta a la información existente en los medicamentos comercializados en este país. Ésta obliga a la inclusión de información de correspondencia respecto a la terminología internacional multilingüe SNOMED-CT. Este proceso es realizado actualmente de forma manual. Este es el punto de partida de este trabajo. Por tanto, el primer objetivo de esta tesis es obtener un método capaz de realizar estas correspondencias (mapeados) de forma automática. Para ello se hará uso de SNOMED-CT como terminología destino de los mapeados y, como origen, los medicamentos comercializados en España existentes en la ontología OntoFIS. Esta ontología ha sido poblada de forma semi-automática a partir de la base de datos oficial del Ministerio de Sanidad Español DIGITALIS. Usar una ontología en lugar de directamente la base de datos aporta ciertos beneficios, como la existencia de conocimiento semántico explicitado (relaciones semánticas), que supondrán una ayuda en el propio proceso de mapeado y, posteriormente, en otros procesos de marcado, extracción de información o clasificación. Para poder alcanzar este objetivo, sin embargo, es necesario equiparar los niveles de especificidad (también conocida como granularidad) de ambos recursos (OntoFIS y SNOMED-CT), ya que no es posible mapear dos recursos con diferentes granularidades. Finalmente, tras haber logrado establecer los mapeados entre ambas terminologías, el último objetivo de la tesis será el de utilizar dichos mapeados para ampliar semánticamente la ontología OntoFIS. Para la consecución de estos tres objetivos, y tras haber estudiado los trabajos existentes en el domino de salud en castellano e inglés, se ha optado por utilizar técnicas de Procesamiento del Lenguaje Natural (PLN), combinándolo con un sistema basado en patrones. Partiendo de las etiquetas del nombre de los medicamentos comercializados en España (nombres de especialidad) junto con las especificaciones existentes en la legislación vigente, se han extraídos una serie de patrones que ayudarán en el proceso de identificación de los elementos de un medicamento, como por ejemplo sus principios activos, sus concentraciones o la población objetivo a la que van dirigidos. Tras haber identificado los elementos componentes de la denominación de los medicamentos, se procede a crear nuevas etiquetas automáticamente para equiparar su granularidad a la existente en SNOMED-CT. Seguidamente se procede al mapeado de las nuevas etiquetas sobre las existentes en SNOMED-CT. El carácter multilingüe de ambos recursos permite poder utilizar el idioma castellano para realizar dicho mapeado. El mapeado se lleva a cabo mediante técnicas de PLN basadas en la similitud léxica, utilizando complementariamente una serie de recursos semánticos específicos creados manualmente. Para establecer la correspondencia se han considerado cuatro grados de mapeado. Estos grados van desde la equivalencia semántica absoluta hasta un mínimo nivel de similitud. De esta forma se maximiza la cobertura de los mapeados. Seguidamente, a partir de los resultados obtenidos en los mapeados y teniendo en cuenta los cuatro grados de diferenciación de los mapeados, se amplía el conocimiento de OntoFIS mediante un sistema basado en reglas. Estas reglas establecen cuánta información puede ser recuperada de los mapeados establecidos, en base al grado de similitud del mapeado. Dichas reglas persiguen evitar introducir información incorrecta o ambigua en OntoFIS. Para concluir, se ha realizado una prueba final a la propuesta, con el fin de establecer unos resultados sólidos sobre el funcionamiento global, validez y seguridad de la propuesta presentada, evitando el sesgo por el estudio cualitativo y las pruebas piloto en el refinamiento de los algoritmos propuestos. Esta prueba persigue una confianza en los resultados del 95%, con un margen de error del 5%. Tras la evaluación de dicha prueba se ha concluido que se han alcanzado todos los objetivos propuestos satisfactoriamente. En dichas pruebas la cobertura obtenida ha variado entre el 90,96% y el 100% y la precisión ha estado comprendida entre el 77,88% y el 100%.
- Published
- 2014
28. Aplicación de la semántica multidimensional, alineamiento léxico-semántico y distancias léxicas al mejoramiento de tareas intermedias del PLN
- Author
-
Fernández Orquín, Antonio, Muñoz Guillena, Rafael, Gutiérrez Vázquez, Yoan, and Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
- Subjects
Lenguajes y Sistemas Informáticos ,Alineamiento léxico-semántico ,Similitud léxico-semántica ,Implicación textual ,Semántica multidimensional ,Paráfrasis ,Distancias de edición - Published
- 2014
29. Resolución de información temporal y su aplicación a la búsqueda de respuestas
- Author
-
Saquete Boró, Estela, Martínez Barco, Patricio, Muñoz Guillena, Rafael, and Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
- Subjects
Expresiones temporales ,Búsqueda de respuestas ,Lenguajes y Sistemas Informáticos ,Procesamiento del lenguaje natural ,Sistema automático - Abstract
Cofinanciado por el Gobierno de España (CICyT) con los proyectos número TIC2000-0664-C02-02 y número TIC2003-07158-C04-01, y el Gobierno de la Comunidad Valenciana (OCyT) con el proyecto número CTIDIB-2002-151.
- Published
- 2005
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.