Back to Search Start Over

AQA: un modelo de anotación anafórico multilingüe para búsqueda de respuestas

Authors :
Boldrini, Ester
Puchol Blasco, Marcel
Navarro Colorado, Borja
Martínez-Barco, Patricio
Vargas-Sierra, Chelo
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Universidad de Alicante. Departamento de Filología Inglesa
Procesamiento del Lenguaje Natural y Sistemas de Información
El Inglés Profesional y Académico
Source :
RUA. Repositorio Institucional de la Universidad de Alicante, Universidad de Alicante (UA)
Publication Year :
2009
Publisher :
Sociedad Española para el Procesamiento del Lenguaje Natural, 2009.

Abstract

En este trabajo presentamos AQA, un modelo multilingüe de anotación de expresiones anafóricas, ideado para ser utilizado en Aprendizaje Automático para mejorar los sistemas de Búsqueda de Repuestas. Con este modelo se ha anotado la colección de preguntas-respuestas del CLEF 2008, concretamente en los idiomas español, italiano e inglés. AQA está inspirado en el meta-modelo MATE, ajustado a nuestras necesidades. Con AQA se especifica la relación entre la anáfora y su antecedente (que puede ser directa o indirecta), las agrupaciones por tópico y cambios de subtópico, así como diferentes tipos de anáforas (pronominal, adverbial, superficial, descripciones definidas y elipsis). Se ha realizado una anotación ciega entre dos anotadores más un árbitro que decide en caso de desacuerdo. Los resultados de la evaluación muestran un 87% de acuerdo entre los anotadores. Algunos problemas de anotación serán expuestos en el trabajo. Nuestra finalidad es ampliar este modelo a otras lenguas y otros corpus, y aplicarlo finalmente en el desarrollo de un sistema de resolución de la anáfora en preguntas-respuestas multilingüe basado en técnicas de aprendizaje automático para mejorar la interacción hombre-máquina. This paper presents AQA, a multilingual anaphora annotation scheme that can be applied in Machine Learning for the improvement of Question Answering systems. It has been used to annotate the collection of CLEF 2008 in Spanish, Italian and English. AQA is inspired by the MATE meta-model, which has been adjusted to our needs. By using AQA we specify the relationship between the anaphora and its antecedent, cases of topic and subtopic, and we label different types of anaphoric expressions. A blind annotation was carried out by two annotators, and a referee for solving cases of disagreement. The results of the evaluation show an 87% level of inter-annotator agreement. Some annotation problems will be reported in this paper. Our aim is to extend this model to other languages, and to apply it to the development of an Anaphora Resolution system based on Machine Learning techniques in order to improve a real human machine-interaction. This paper has been supported by the following projects: “Question Answering Learning technologies in a multiLingual and Multimodal Environment QALL-ME” (FP6 IST-033860), “Intelligent, Interactive and Multilingual Text Mining based on Human Language Technologies, TEXT-MESS” (TIN2006-15265-C06-01), by the Generalitat Valenciana throught the research grant BFPI06/182, and by the grant BII2008-7898717 of the University of Alicante.

Details

Database :
OpenAIRE
Journal :
RUA. Repositorio Institucional de la Universidad de Alicante, Universidad de Alicante (UA)
Accession number :
edsair.RECOLECTA.....f7c31f0b3cde44de87f2863633521abd