19 results on '"Sistemas de búsqueda de respuestas"'
Search Results
2. Evaluación del rendimiento de los sistemas de búsqueda de respuestas de dominio general
- Author
-
María-Dolores Olvera-Lobo and Juncal Gutiérrez-Artacho
- Subjects
recuperación de información ,sistemas de búsqueda de respuestas ,evaluación ,medidas de evaluación ,world wide web ,Bibliography. Library science. Information resources - Abstract
Los sistemas de búsqueda de respuestas (SBR) son una alternativa a los tradicionales sistemas de recuperación de información tratando de ofrecer respuestas precisas y comprensibles a preguntas factuales, en lugar de presentar al usuario una lista de documentos relacionados con su búsqueda. Se ha evaluado la eficacia de cuatro SBR disponibles en la Web —QuALiM, SEMOTE, START, y TrueKnowledge—, mediante una amplia muestra de preguntas de definición, factuales y de lista, pertenecientes a distintos dominios temáticos. Se utilizó una colección de 500 preguntas cuyas respuestas fueron valoradas por los usuarios y, posteriormente, se aplicaron varias medidas para su evaluación (MRR, TRR, FHS, MAP y precisión). Se observa que START y TrueKnowledge presentan un nivel aceptable de respuestas correctas, precisas y en una secuencia bien ordenada. Los resultados obtenidos revelan el potencial de esta clase de herramientas en el ámbito del acceso y la recuperación de información de dominio general.
- Published
- 2013
- Full Text
- View/download PDF
3. La inteligencia artificial jurídica: nuevas herramientas y perspectivas metodológicas para el jurista
- Author
-
José Ignacio Solar Cayón
- Subjects
legal relevance ,sistemas expertos jurídicos ,kodifikacija ,predictive codification ,relevancia jurídica ,codificación predictiva ,answer search systems ,codificación ,pravni strokovni sistemi ,prediktivna kodifikacija ,legal expert systems ,predictive analysis ,prediktivna analiza ,sistemas de búsqueda de respuestas ,análisis predictivo ,iskalniki odgovorov ,pravna umetna inteligenca ,codification ,pravna relevantnost ,Legal artificial intelligence ,Law ,inteligencia artificial jurídica - Abstract
La relación entre Derecho e inteligencia artificial es bidireccional. De un lado, aquella se ha convertido en una materia objeto de atención preferente por parte del jurista, preocupado por establecer un marco jurídico adecuado para hacer frente a sus riesgos. Asistimos así al surgimiento de un incipiente “Derecho de la inteligencia artificial”. Pero, de otro, la propia actividad jurídica está comenzando a ser transformada como consecuencia de la paulatina introducción de “la inteligencia artificial en el Derecho”. La combinación de las técnicas de big data, aprendizaje automático y procesamiento del lenguaje natural está permitiendo el diseño de herramientas para automatizar tareas jurídicas que hasta ahora sólo podían ser realizadas por juristas expertos. El desarrollo de esta “inteligencia artificial jurídica” presenta ciertas dificultades, debido fundamentalmente a las peculiaridades del razonamiento jurídico. En el trabajo se exponen algunos de los principales sistemas de inteligencia artificial jurídica -plataformas de búsqueda de respuestas jurídicas, herramientas de codificación predictiva y aplicaciones de análisis predictivo-, subrayando sus singularidades y sus aportaciones al arsenal metodológico del jurista. The relationship between law and artificial intelligence is bidirectional. On the one hand, it has become a preferred object of lawyers’ attention, who are concerned with establishing an adequate legal framework to face its risks. We are thus witnessing the emergence of an incipient "Artificial Intelligence Law". On the other hand, the legal activity itself is beginning to be transformed as a consequence of the gradual introduction of “artificial intelligence in the Law”. The combination of big data, machine learning and natural language processing techniques is allowing the design of tools automating legal tasks that until now could only be performed by expert jurists. The development of this "legal artificial intelligence" presents certain difficulties, mainly due to the peculiarities of legal reasoning. In this paper, the author presents some of the main legal artificial intelligence systems, namely platforms for seeking legal answers, predictive codification tools and predictive analysis applications. He highlights their singularities and their contributions to the methodological arsenal of the jurist. Pravna umetna inteligenca. Nova orodja in metodološke perspektive za pravnike. Odnos med pravom in umetno inteligenco je dvosmeren. Po eni strani je umetna inteligenca postala privilegiran predmet pozornosti pravnikov, ki se ukvarjajo z vzpostavitvijo ustreznega pravnega okvirja za soočanje s tveganji, ki jih prva predstavlja. Tako smo priča začetnemu razvoju »prava umetne inteligence«. Po drugi strani pa se sama dejavnost pravnikov spreminja na račun postopnega razvoja »umetne inteligence v pravu«. Kombinacija velikega podatkovja, strojnega učenja ter tehnik obdelave naravnega jezika omogoča razvoj orodij za avtomatizacijo pravnih nalog, ki so jih do nedavno lahko opravljali le izkušeni pravniki. Razvoj te »pravne umetne inteligence« predstavlja določene težave, predvsem zaradi posebnosti pravnega razlogovanja. Avtor v tem članku predstavi nekatere osrednje pravne sisteme umetne inteligence, in sicer platforme za iskanje pravnih odgovorov, orodja prediktivne kodifikacije ter aplikacije prediktivne analize. Pri tem poudari njihove posebnosti ter njihov prispevek k metodološkemu instrumentariju pravnikov.
- Published
- 2020
- Full Text
- View/download PDF
4. Evaluación del rendimiento de los sistemas de búsqueda de respuestas de dominio general.
- Author
-
Olvera-Lobo, María-Dolores and Gutiérrez-Artacho, Juncal
- Published
- 2013
- Full Text
- View/download PDF
5. Tratamiento lingüístico de las preguntas en español en los sistemas de búsqueda de respuestas.
- Author
-
Olvera-Lobo, María-Dolores and Robinson-García, Nicolás
- Subjects
- *
LINGUISTICS research , *INFORMATION architecture , *TAXONOMY , *DATA analysis , *QUESTION answering systems , *SPANISH language - Abstract
We propose a procedure for the linguistic treatment of Spanish questions as a step prior to their classification in question answering systems. The main types of question answering systems and their basic architecture are described. We review the principal question classification taxonomies used to date and the different fields from which they have been derived. Finally, we present the stages of linguistic analysis that the text of questions in question answering systems should be subject to in order to facilitate the location of appropriate answers. [ABSTRACT FROM AUTHOR]
- Published
- 2009
- Full Text
- View/download PDF
6. Nuevas tendencias en recuperación de información: la búsqueda de respuestas desde la perspectiva de la traducción
- Author
-
Olvera Lobo, María Dolores and Gutiérrez Artacho, Juncal
- Subjects
Sistemas de búsqueda de respuestas ,Herramientas para la traducción ,Traducción ,Evaluación ,L. Information technology and library technology ,Recuperación de información - Abstract
En el entorno de la Web la sobrecarga de información se deja sentir aún más que en otros contextos. De esta forma, en demasiadas ocasiones, al plantear una determinada consulta en las herramientas de búsqueda de información Web el número de páginas Web recuperadas resulta excesivo y no todas ellas son relevantes ni útiles para los objetivos del usuario. Un paso en la evolución hacia la mejora de la RI son los sistemas de búsqueda de respuestas (SBR) translingües, que se presentan como una alternativa a los tradicionales sistemas de RI tratando de ofrecer respuestas precisas y comprensibles a preguntas factuales, en lugar de presentar al usuario una lista de documentos relacionados con la búsqueda, de modo que el usuario no ha de leer documentos completos para obtener la información requerida. Se han estudiado, analizado y evaluado los diferentes SBR disponibles en la Web, tanto monolingües como multilingües, de dominio general y del especializado, para comprobar su relevancia y utilidad en los estudios y en la profesión del traductor. Además, se ha procedido al análisis de los recursos lingüísticos utilizados en los SBR multilingües y translingües, y a la evaluación de su uso real y eficacia mediante técnicas cuantitativas y cualitativas., Grupo de Investigación: Acceso y evaluación de la información científica (HUM466).
- Published
- 2013
7. Bootstrapping named entity resources for adaptive question answering systems
- Author
-
Pablo Sánchez, César de, Martínez Fernández, Paloma, Universidad Carlos III de Madrid. Departamento de Informática, and UC3M. Departamento de Informática
- Subjects
Informática ,Question Answering systems ,Detección y Clasificación de Relaciones ,NERC ,Recuperación de la información ,RDC ,Named Entities Recognition and Classification ,Sistemas de Búsqueda de Respuestas ,Information Retrieval ,Bootstrapping ,Relation Detection and Characterization ,QA ,SBR ,Clasificación de Entidades Nombradas - Abstract
Los Sistemas de Búsqueda de Respuestas (SBR) amplían las capacidades de un buscador de información tradicional con la capacidad de encontrar respuestas precisas a las preguntas del usuario. El objetivo principal es facilitar el acceso a la información y disminuir el tiempo y el esfuerzo que el usuario debe emplear para encontrar una información concreta en una lista de documentos relevantes. En esta investigación se han abordado dos trabajos relacionados con los SBR. La primera parte presenta una arquitectura para SBR en castellano basada en la combinación y adaptación de diferentes técnicas de Recuperación y de Extracción de Información. Esta arquitectura está integrada por tres módulos principales que incluyen el análisis de la pregunta, la recuperación de pasajes relevantes y la extracción y selección de respuestas. En ella se ha prestado especial atención al tratamiento de las Entidades Nombradas puesto que, con frecuencia, son el tema de las preguntas o son buenas candidatas como respuestas. La propuesta se ha encarnado en el SBR del grupo MIRACLE que ha sido evaluado de forma independiente durante varias ediciones en la tarea compartida CLEF@QA, parte del foro de evaluación competitiva Cross-Language Evaluation Forum (CLEF). Se describen aquí las participaciones y los resultados obtenidos entre 2004 y 2007. El SBR de MIRACLE ha obtenido resultados moderados en el desempeño de la tarea con tasas de respuestas correctas entre el 20% y el 30%. Entre los resultados obtenidos destacan los de la tarea principal de 2005 y la tarea piloto de Búsqueda de Respuestas en tiempo real de 2006, RealTimeQA. Esta última tarea, además de requerir respuestas correctas incluía el tiempo de respuesta como un factor adicional en la evaluación. Estos resultados respaldan la validez de la arquitectura propuesta como una alternativa viable para los SBR sobre colecciones textuales y también corrobora resultados similares para el inglés y otras lenguas. Por otro lado, el análisis de los resultados a lo largo de las diferentes ediciones de CLEF así como la comparación con otros SBR apunta nuevos problemas y retos. Según nuestra experiencia, los sistemas de QA son más complicados de adaptar a otros dominios y lenguas que los sistemas de Recuperación de Información. Este problema viene heredado del uso de herramientas complejas de análisis de lenguaje como analizadores morfológicos, sintácticos y semánticos. Entre estos últimos se cuentan las herramientas para el Reconocimiento y Clasificación de Entidades Nombradas (NERC en inglés) así como para la Detección y Clasificación de Relaciones (RDC en inglés). Debido a la di cultad de adaptación del SBR a distintos dominios y colecciones, en la segunda parte de esta tesis se investiga una propuesta diferente basada en la adquisición de conocimiento mediante métodos de aprendizaje ligeramente supervisado. El objetivo de esta investigación es adquirir recursos semánticos útiles para las tareas de NERC y RDC usando colecciones de textos no anotados. Además, se trata de eliminar la dependencia de herramientas de análisis lingüístico con el fin de facilitar que las técnicas sean portables a diferentes dominios e idiomas. En primer lugar, se ha realizado un estudio de diferentes algoritmos para NERC y RDC de forma semisupervisada a partir de unos pocos ejemplos (bootstrapping). Este trabajo propone primero una arquitectura común y compara diferentes funciones que se han usado en la evaluación y selección de resultados intermedios, tanto instancias como patrones. La principal propuesta es un nuevo algoritmo que permite la adquisición simultánea e iterativa de instancias y patrones asociados a una relación. Incluye también la posibilidad de adquirir varias relaciones de forma simultánea y mediante el uso de la hipótesis de exclusividad obtener mejores resultados. Como característica distintiva el algoritmo explora la colección de textos con una estrategia basada en indización, que permite adquirir conocimiento de grandes colecciones. La estrategia de selección de candidatos y la evaluación se basan en la construcción de un grafo de instancias y patrones, que justifica nuestro método para la selección de candidatos. Este procedimiento es semejante al frente de exploración de una araña web y permite encontrar las instancias más parecidas a las semillas con las evidencias disponibles. Este algoritmo se ha implementado en el sistema SPINDEL y para su evaluación se ha comenzado con el caso concreto de la adquisición de recursos para las clases de Entidades Nombradas más comunes, Persona, Lugar y Organización. El objetivo es adquirir nombres asociados a cada una de las categorías así como patrones contextuales que permitan detectar menciones asociadas a una clase. Se presentan resultados para la adquisición de dos idiomas distintos, castellano e inglés, y para el castellano, en dos dominios diferentes, noticias y textos de una enciclopedia colaborativa, Wikipedia. En ambos casos el uso de herramientas de análisis lingüístico se ha limitado de acuerdo con el objetivo de avanzar hacia la independencia de idioma. Las listas adquiridas mediante bootstrapping parten de menos de 40 semillas por clase y obtienen del orden de 30.000 instancias de calidad variable. Además se obtienen listas de patrones indicativos asociados a cada clase de entidad. La evaluación indirecta confirma la utilidad de ambos recursos en la clasificación de Entidades Nombradas usando un enfoque simple basado únicamente en diccionarios. La mejor configuración obtiene para la clasificación en castellano una medida F de 67,17 y para inglés de 55,99. Además se confirma la utilidad de los patrones adquiridos que en ambos casos ayudan a mejorar la cobertura. El módulo requiere menor esfuerzo de desarrollo que los enfoques supervisados, si incluimos la necesidad de anotación, aunque su rendimiento es inferior por el momento. En definitiva, esta investigación constituye un primer paso hacia el desarrollo de aplicaciones semánticas como los SBR que requieran menos esfuerzo de adaptación a un dominio o lenguaje nuevo., Question Answering (QA) systems add new capabilities to traditional search engines with the ability to find precise answers to user questions. Their objective is to enable easier information access by reducing the time and effort that the user requires to find a concrete information among a list of relevant documents. In this thesis we have carried out two works related with QA systems. The first part introduces an architecture for QA systems for Spanish which is based on the combination and adaptation of different techniques from Information Retrieval (IR) and Information Extraction (IE). This architecture is composed by three modules that include question analysis, relevant passage retrieval and answer extraction and selection. The appropriate processing of Named Entities (NE) has received special attention because of their importance as question themes and candidate answers. The proposed architecture has been implemented as part of the MIRACLE QA system. This system has taken part in independent evaluations like the CLEF@QA track in the Cross-Language Evaluation Forum (CLEF). Results from 2004 to 2007 campaigns as well as the details and the evolution of the system have been described in deep. The MIRACLE QA system has obtained moderate performance with a first answer accuracy ranging between 20% and 30%. Nevertheless, it is important to highlight the results obtained in the 2005 main QA task and the RealTimeQA pilot task in 2006. The last one included response time as an important additional variable of the evaluation. These results back the proposed architecture as an option for QA from textual collection and confirm similar findings obtained for English and other languages. On the other hand, the analysis of the results along evaluation campaigns and the comparison with other QA systems point problems with current systems and new challenges. According to our experience, it is more dificult to tailor QA systems to different domains and languages than IR systems. The problem is inherited by the use of complex language analysis tools like POS taggers, parsers and other semantic analyzers, like NE Recognition and Classification (NERC) and Relation Detection and Characterization (RDC) tools. The second part of this thesis tackles this problem and proposes a different approach to adapting QA systems for di erent languages and collections. The proposal focuses on acquiring knowledge for the semantic analyzers based on lightly supervised approaches. The goal is to obtain useful resources that help to perform NERC or RDC using as few annotated resources as possible. Besides, we try to avoid dependencies from other language analysis tools with the purpose that these methods apply to different languages and domains. First of all, we have study previous work on building NERC and RDC modules with few supervision, particularly bootstrapping methods. We propose a common framework for different bootstrapping systems that help to unify different evaluation functions for intermediate results. The main proposal is a new algorithm that is able to simultaneously acquire instances and patterns associated to a relation of interest. It also uses mutual exclusion among relations to reduce concept drift and achieve better results. A distinctive characteristic is that it uses a query based exploration strategy of the text collection which enables their use for larger collections. Candidate selection and evaluation are based on incrementally building a graph of instances and patterns which also justifies our evaluation function. The discovery approach is analogous to the front of exploration in a web crawler and it is able to find the most similar instances to the available seeds. This algorithm has been implemented in the SPINDEL system. We have selected for evaluation the task of acquiring resources for the most common NE classes, Person, Location and Organization. The objective is to acquire name instances that belong to any of the classes as well as contextual patterns that help to detect mentions of NE that belong to that class. We present results for the acquisition of resources from raw text from two different languages, Spanish and English. We also performed experiments for Spanish in two different collections, news and texts from a collaborative encyclopedia, Wikipedia. Both cases are tackled with limited language analysis tools and resources. With an initial list of 40 instance seeds, the bootstrapping process is able to acquire large name lists containing up to 30.000 instances with a variable quality. Besides, large lists of indicative patterns are obtained too. Our indirect evaluation confirms the utility of both resources to classify NE using a simple dictionary recognition approach. Best results for Spanish obtained a F-score of 67,17 and for English this value is 55,99. The module requires much less development effort than annotation for supervised algorithms although the performance is not in pair yet. This research is a first step towards the development of semantic applications like QA for a new language or domain with no annotated corpora that requires less adaptation effort.
- Published
- 2011
8. AQA: a multilingual anaphora annotation scheme for question answering
- Author
-
Boldrini, Ester, Puchol Blasco, Marcel, Navarro Colorado, Borja, Martínez-Barco, Patricio, Vargas-Sierra, Chelo, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Departamento de Filología Inglesa, Procesamiento del Lenguaje Natural y Sistemas de Información, and El Inglés Profesional y Académico
- Subjects
Sistemas de búsqueda de respuestas ,Interaction ,Multilingual corpora ,Interacción ,Machine learning ,Lenguajes y Sistemas Informáticos ,Corpus multilingüe ,Question answering systems ,Resolución de la anáfora ,Acuerdo de anotación ,Aprendizaje automático ,Interannotator agreement ,Anaphora resolution - Abstract
En este trabajo presentamos AQA, un modelo multilingüe de anotación de expresiones anafóricas, ideado para ser utilizado en Aprendizaje Automático para mejorar los sistemas de Búsqueda de Repuestas. Con este modelo se ha anotado la colección de preguntas-respuestas del CLEF 2008, concretamente en los idiomas español, italiano e inglés. AQA está inspirado en el meta-modelo MATE, ajustado a nuestras necesidades. Con AQA se especifica la relación entre la anáfora y su antecedente (que puede ser directa o indirecta), las agrupaciones por tópico y cambios de subtópico, así como diferentes tipos de anáforas (pronominal, adverbial, superficial, descripciones definidas y elipsis). Se ha realizado una anotación ciega entre dos anotadores más un árbitro que decide en caso de desacuerdo. Los resultados de la evaluación muestran un 87% de acuerdo entre los anotadores. Algunos problemas de anotación serán expuestos en el trabajo. Nuestra finalidad es ampliar este modelo a otras lenguas y otros corpus, y aplicarlo finalmente en el desarrollo de un sistema de resolución de la anáfora en preguntas-respuestas multilingüe basado en técnicas de aprendizaje automático para mejorar la interacción hombre-máquina. This paper presents AQA, a multilingual anaphora annotation scheme that can be applied in Machine Learning for the improvement of Question Answering systems. It has been used to annotate the collection of CLEF 2008 in Spanish, Italian and English. AQA is inspired by the MATE meta-model, which has been adjusted to our needs. By using AQA we specify the relationship between the anaphora and its antecedent, cases of topic and subtopic, and we label different types of anaphoric expressions. A blind annotation was carried out by two annotators, and a referee for solving cases of disagreement. The results of the evaluation show an 87% level of inter-annotator agreement. Some annotation problems will be reported in this paper. Our aim is to extend this model to other languages, and to apply it to the development of an Anaphora Resolution system based on Machine Learning techniques in order to improve a real human machine-interaction. This paper has been supported by the following projects: “Question Answering Learning technologies in a multiLingual and Multimodal Environment QALL-ME” (FP6 IST-033860), “Intelligent, Interactive and Multilingual Text Mining based on Human Language Technologies, TEXT-MESS” (TIN2006-15265-C06-01), by the Generalitat Valenciana throught the research grant BFPI06/182, and by the grant BII2008-7898717 of the University of Alicante.
- Published
- 2009
9. Application of temporal information extraction techniques to question answering systems
- Author
-
Vicente Díez, María Teresa, Martínez Fernández, Paloma, Martínez González, Ángel, and Martínez Fernández, José Luis
- Subjects
Sistemas de búsqueda de respuestas ,Tratamiento de información temporal ,Temporal inference ,Lenguajes y Sistemas Informáticos ,Razonamiento temporal ,Question-answering systems ,Temporal information management - Abstract
En este trabajo, proponemos la integración de un sistema de reconocimiento, resolución y normalización de expresiones temporales en un sistema de búsqueda de respuestas para español. Las fases de análisis de la pregunta y de extracción de respuestas han sido adaptadas a las nuevas capacidades del sistema para la detección e inferencia temporal. Dicho sistema ha sido evaluado a través de un corpus de preguntas propuesto para la tarea principal de QA@CLEF2008. Los resultados obtenidos muestran mejoras relativamente significativas tanto en la cantidad de las respuestas acertadas como en la calidad de las mismas. This work proposes the integration of a temporal expressions recognition, resolution and normalization system into a question answering system for Spanish. Both question analysis and answer extraction stages have been adapted to the new capabilities for temporal detection and inference of the system. It has been evaluated by means of a corpus composed of questions that has been originally developed for the main task of QA@CLEF2008. The obtained results show quite significant improvements both in terms of quantity of correct answers and in the quality of them. Este trabajo ha sido parcialmente financiado por la Comunidad de Madrid bajo la Red de Investigación MAVIR (S-0505/TIC-0267), y por el Ministerio de Educación en el marco del proyecto BRAVO (TIN2007-67407-C3-01).
- Published
- 2009
10. Linguistic treatment of questions in Spanish for question classification in question answering systems
- Author
-
Olvera Lobo, María Dolores and Robinson García, Nicolás
- Subjects
Sistemas de búsqueda de respuestas ,Clasificación de preguntas ,Question classification ,Lengua española ,Natural language processing ,Question answering systems ,Spanish language ,Procesamiento del lenguaje natural ,Análisis lingüístico de las preguntas ,Linguistic analysis of questions - Abstract
Se propone un procedimiento para el tratamiento lingüístico de las preguntas en español como paso previo a su clasificación en los sistemas de búsqueda de respuestas. Se mencionan los principales tipos de sistemas de búsqueda de respuestas y su arquitectura básica. Se revisan las principales taxonomías utilizadas hasta el momento para la clasificación de preguntas y las distintas perspectivas desde las que se enfocan. Finalmente, se presentan las etapas de análisis lingüístico a las que ha de someterse el texto de las preguntas en estos sistemas para facilitar la localización de las respuestas adecuadas. We propose a procedure for the linguistic treatment of Spanish questions as a step prior to their classification in question answering systems. The main types of question answering systems and their basic architecture are described. We review the principal question classification taxonomies used to date and the different fields from which they have been derived. Finally, we present the stages of linguistic analysis that the text of questions in question answering systems should be subject to in order to facilitate the location of appropriate answers.
- Published
- 2009
11. Linguistic treatment of questions in Spanish for question classification in question answering systems
- Author
-
Olvera-Lobo, María-Dolores and Robinson-García, Nicolás
- Subjects
Sistemas de búsqueda de respuestas ,Clasificación de preguntas ,Question classification ,Lengua española ,Natural language processing ,Question answering systems ,Spanish language ,Procesamiento del lenguaje natural ,Análisis lingüístico de las preguntas ,Linguistic analysis of questions - Abstract
Se propone un procedimiento para el tratamiento lingüístico de las preguntas en español como paso previo a su clasificación en los sistemas de búsqueda de respuestas. Se mencionan los principales tipos de sistemas de búsqueda de respuestas y su arquitectura básica. Se revisan las principales taxonomías utilizadas hasta el momento para la clasificación de preguntas y las distintas perspectivas desde las que se enfocan. Finalmente, se presentan las etapas de análisis lingüístico a las que ha de someterse el texto de las preguntas en estos sistemas para facilitar la localización de las respuestas adecuadas., We propose a procedure for the linguistic treatment of Spanish questions as a step prior to their classification in question answering systems. The main types of question answering systems and their basic architecture are described. We review the principal question classification taxonomies used to date and the different fields from which they have been derived. Finally, we present the stages of linguistic analysis that the text of questions in question answering systems should be subject to in order to facilitate the location of appropriate answers.
- Published
- 2009
12. AQA: un modelo de anotación anafórico multilingüe para búsqueda de respuestas
- Author
-
Boldrini, Ester, Puchol Blasco, Marcel, Navarro Colorado, Borja, Martínez-Barco, Patricio, Vargas-Sierra, Chelo, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Departamento de Filología Inglesa, Procesamiento del Lenguaje Natural y Sistemas de Información, and El Inglés Profesional y Académico
- Subjects
Sistemas de búsqueda de respuestas ,Interaction ,Multilingual corpora ,Interacción ,Machine learning ,Lenguajes y Sistemas Informáticos ,Corpus multilingüe ,Question answering systems ,Resolución de la anáfora ,Acuerdo de anotación ,Aprendizaje automático ,Interannotator agreement ,Anaphora resolution - Abstract
En este trabajo presentamos AQA, un modelo multilingüe de anotación de expresiones anafóricas, ideado para ser utilizado en Aprendizaje Automático para mejorar los sistemas de Búsqueda de Repuestas. Con este modelo se ha anotado la colección de preguntas-respuestas del CLEF 2008, concretamente en los idiomas español, italiano e inglés. AQA está inspirado en el meta-modelo MATE, ajustado a nuestras necesidades. Con AQA se especifica la relación entre la anáfora y su antecedente (que puede ser directa o indirecta), las agrupaciones por tópico y cambios de subtópico, así como diferentes tipos de anáforas (pronominal, adverbial, superficial, descripciones definidas y elipsis). Se ha realizado una anotación ciega entre dos anotadores más un árbitro que decide en caso de desacuerdo. Los resultados de la evaluación muestran un 87% de acuerdo entre los anotadores. Algunos problemas de anotación serán expuestos en el trabajo. Nuestra finalidad es ampliar este modelo a otras lenguas y otros corpus, y aplicarlo finalmente en el desarrollo de un sistema de resolución de la anáfora en preguntas-respuestas multilingüe basado en técnicas de aprendizaje automático para mejorar la interacción hombre-máquina. This paper presents AQA, a multilingual anaphora annotation scheme that can be applied in Machine Learning for the improvement of Question Answering systems. It has been used to annotate the collection of CLEF 2008 in Spanish, Italian and English. AQA is inspired by the MATE meta-model, which has been adjusted to our needs. By using AQA we specify the relationship between the anaphora and its antecedent, cases of topic and subtopic, and we label different types of anaphoric expressions. A blind annotation was carried out by two annotators, and a referee for solving cases of disagreement. The results of the evaluation show an 87% level of inter-annotator agreement. Some annotation problems will be reported in this paper. Our aim is to extend this model to other languages, and to apply it to the development of an Anaphora Resolution system based on Machine Learning techniques in order to improve a real human machine-interaction. This paper has been supported by the following projects: “Question Answering Learning technologies in a multiLingual and Multimodal Environment QALL-ME” (FP6 IST-033860), “Intelligent, Interactive and Multilingual Text Mining based on Human Language Technologies, TEXT-MESS” (TIN2006-15265-C06-01), by the Generalitat Valenciana throught the research grant BFPI06/182, and by the grant BII2008-7898717 of the University of Alicante.
- Published
- 2009
13. AQA: a multilingual anaphora annotation scheme for question answering
- Author
-
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Departamento de Filología Inglesa, Boldrini, Ester, Puchol Blasco, Marcel, Navarro Colorado, Borja, Martínez-Barco, Patricio, Vargas-Sierra, Chelo, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante. Departamento de Filología Inglesa, Boldrini, Ester, Puchol Blasco, Marcel, Navarro Colorado, Borja, Martínez-Barco, Patricio, and Vargas-Sierra, Chelo
- Abstract
En este trabajo presentamos AQA, un modelo multilingüe de anotación de expresiones anafóricas, ideado para ser utilizado en Aprendizaje Automático para mejorar los sistemas de Búsqueda de Repuestas. Con este modelo se ha anotado la colección de preguntas-respuestas del CLEF 2008, concretamente en los idiomas español, italiano e inglés. AQA está inspirado en el meta-modelo MATE, ajustado a nuestras necesidades. Con AQA se especifica la relación entre la anáfora y su antecedente (que puede ser directa o indirecta), las agrupaciones por tópico y cambios de subtópico, así como diferentes tipos de anáforas (pronominal, adverbial, superficial, descripciones definidas y elipsis). Se ha realizado una anotación ciega entre dos anotadores más un árbitro que decide en caso de desacuerdo. Los resultados de la evaluación muestran un 87% de acuerdo entre los anotadores. Algunos problemas de anotación serán expuestos en el trabajo. Nuestra finalidad es ampliar este modelo a otras lenguas y otros corpus, y aplicarlo finalmente en el desarrollo de un sistema de resolución de la anáfora en preguntas-respuestas multilingüe basado en técnicas de aprendizaje automático para mejorar la interacción hombre-máquina., This paper presents AQA, a multilingual anaphora annotation scheme that can be applied in Machine Learning for the improvement of Question Answering systems. It has been used to annotate the collection of CLEF 2008 in Spanish, Italian and English. AQA is inspired by the MATE meta-model, which has been adjusted to our needs. By using AQA we specify the relationship between the anaphora and its antecedent, cases of topic and subtopic, and we label different types of anaphoric expressions. A blind annotation was carried out by two annotators, and a referee for solving cases of disagreement. The results of the evaluation show an 87% level of inter-annotator agreement. Some annotation problems will be reported in this paper. Our aim is to extend this model to other languages, and to apply it to the development of an Anaphora Resolution system based on Machine Learning techniques in order to improve a real human machine-interaction.
- Published
- 2009
14. Aplicación de técnicas de extracción de información temporal a los sistemas de búsqueda de respuestas
- Author
-
Vicente Díez, María Teresa, Martínez Fernández, Paloma, Martínez González, Ángel, Martínez Fernández, José Luis, Vicente Díez, María Teresa, Martínez Fernández, Paloma, Martínez González, Ángel, and Martínez Fernández, José Luis
- Abstract
En este trabajo, proponemos la integración de un sistema de reconocimiento, resolución y normalización de expresiones temporales en un sistema de búsqueda de respuestas para español. Las fases de análisis de la pregunta y de extracción de respuestas han sido adaptadas a las nuevas capacidades del sistema para la detección e inferencia temporal. Dicho sistema ha sido evaluado a través de un corpus de preguntas propuesto para la tarea principal de QA@CLEF2008. Los resultados obtenidos muestran mejoras relativamente significativas tanto en la cantidad de las respuestas acertadas como en la calidad de las mismas., This work proposes the integration of a temporal expressions recognition, resolution and normalization system into a question answering system for Spanish. Both question analysis and answer extraction stages have been adapted to the new capabilities for temporal detection and inference of the system. It has been evaluated by means of a corpus composed of questions that has been originally developed for the main task of QA@CLEF2008. The obtained results show quite significant improvements both in terms of quantity of correct answers and in the quality of them.
- Published
- 2009
15. Un entorno para el desarrollo y la evaluación de un sistema de búsqueda de respuestas en euskera
- Author
-
Ansa Osteriz, Olatz, Arregi Iparragirre, Patxi Xabier, Esparza, Itsaso, and Valverde, Andoni
- Subjects
Sistemas de búsqueda de respuestas ,Question answering systems - Abstract
En este artículo se presenta una plataforma de desarrollo y evaluación de un sistema de búsqueda de respuestas (BR), para preguntas escritas en euskera y sobre una colección de documentos en euskera. La plataforma integra tres componentes: el propio sistema de BR, el componente léxico y el entorno de evaluación. El sistema de BR se ha ideado atendiendo a los requisitos de evaluación. Se ha optado por una arquitectura distribuida, que integra servicios web autónomos. Se describe una experiencia piloto, que ha permitido validar la adecuación del entorno y que sienta las bases para el trabajo futuro. This paper presents a development and evaluation platform for a question answering (QA) system. It is a monolingual system, which takes as input Basque questions and searches for answers in a Basque document collection. Three components integrate the platform: the QA system, the lexical component and the evaluation environment. The QA system has been designed taking into account the evaluation requirements. A distributed architecture with stand-alone web services has been adopted. A pilot experiment is also described and this experiment has allowed ratifying the environment adaptation and has laid the foundations for future work. Este trabajo está subvencionado por el Departamento de Industria del Gobierno Vasco (proyectos Ihardetsi SAIOTEK S-PE03UN14 e Hizking21 ETORTEK2002HIZKING21).
- Published
- 2005
16. Búsqueda de respuestas multilingüe : clasificación de preguntas en español basada en aprendizaje
- Author
-
García Cumbreras, Miguel Ángel, Martínez Santiago, Fernando, Ureña López, Luis Alfonso, and Montejo Ráez, Arturo
- Subjects
Clasificación de preguntas ,Sistemas de búsqueda de respuestas ,Question classification ,Machine learning ,Question answering systems ,Traductores automáticos ,Machine translation ,Aprendizaje automático - Abstract
Este artículo presenta un sistema de clasificación de preguntas en español basado en aprendizaje, utilizando colecciones en inglés y diversas máquinas de traducción online como recursos de traducción de la pregunta original en español al inglés. En este estudio se mide de forma cuantitativa la bondad de cuatro traductores automáticos para la pareja de idiomas español-inglés, comparando los resultados obtenidos para las preguntas originales en inglés con los obtenidos de cada una de las traducciones. El sistema se ha implementado de forma modular utilizando varios métodos de aprendizaje tales como LibSVM, Bayesian Logistic Regression o PLAUM. En la tarea de clasificación de preguntas se demuestra que la pérdida de precisión debida a la traducción automática es moderada, situandose entorno a un 5 %. This paper presents an Spanish question classification system based on machine learning, that uses English collections, different online machine translators and other NLP English resources. The original Spanish questions are translated into English. Four machine translators are evaluated in terms of precision and the results are compared with the result obtained by using original English questions. Our system has been developed into separated modules and we have tested several machine learning methods, such as LibSVM, Bayesian Logistic Regression or PLAUM. The obtained results show that these online machine translators, used for the language pair Spanish-English, and for the query translation task in a multilingual question answering system, work well. It is showed that the loss of precision because of the machine translation, in a question classification task, is reasonable, around 5 %. Este trabajo ha sido financiado por el Ministerio de Ciencia y Tecnología mediante el proyecto TIC2003-07158-C04-04.
- Published
- 2005
17. SEMQA : un modelo semántico aplicado a los sistemas de búsqueda de respuestas
- Author
-
Vicedo, Jose-Luis
- Subjects
Sistemas de búsqueda de respuestas ,WordNet ,Question answering systems ,Information retrieval ,Semántica ,Recuperación de información ,Semantics - Abstract
Director de la tesis: Antonio Ferrández Rodríguez (Universidad de Alicante) Esta tesis presenta la definición de un modelo de representación de la información textual que aglutina sus características léxicas, sintácticas y semánticas en una unidad de información. Dicha unidad se emplea en tareas de búsqueda de respuestas superando así las limitaciones de los modelos basados en la co-ocurrencia de términos. This thesis defines a model for representing textual information that includes its lexical, syntactic and semantic characteristics into an information unit. This unit is used for Question Answering tasks overcoming this way, the limitations of term co-occurrence approaches. Esta investigación ha sido parcialmente financiada por el Ministerio de Ciencia y Tecnología a través del proyecto TIC2000-0664-C02-01/02.
- Published
- 2002
18. ¿Cómo influye la resolución de la anáfora pronominal en los sistemas de búsqueda de respuestas?
- Author
-
Vicedo, Jose-Luis, Ferrández, Antonio, and Peral, Jesús
- Subjects
Sistemas de búsqueda de respuestas ,Dominios no restringidos ,Resolución de la anáfora pronominal - Abstract
La finalidad de este artículo consiste en analizar los efectos de aplicar técnicas de resolución de la anáfora pronominal en Sistemas de Búsqueda de Respuestas sobre dominios no restringidos (open domain Question Answering Systems - QA). Para ello, se ha implementado un sistema completo de QA y se analiza cómo varía su comportamiento al resolver la anáfora pronominal. Las pruebas se han efectuado sobre una colección de textos escritos en inglés. La evaluación del sistema demuestra que las medidas del rendimiento del sistema mejoran cuando se tiene en cuenta la información referida anafóricamente en los documentos.
- Published
- 2000
19. SEMQA: un modelo semántico aplicado a los sistemas de búsqueda de respuestas
- Author
-
Ferrández, Antonio, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Vicedo, Jose-Luis, Ferrández, Antonio, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, and Vicedo, Jose-Luis
- Published
- 2002
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.