Back to Search
Start Over
Aplicación del procesamiento de lenguaje natural en la recuperación de información
- Source :
- RUA. Repositorio Institucional de la Universidad de Alicante, Universidad de Alicante (UA)
- Publication Year :
- 2005
- Publisher :
- Sociedad Española para el Procesamiento del Lenguaje Natural, 2005.
-
Abstract
- En este artículo se presenta un modelo innovador para la Recuperación de Información monolingüe en inglés y español. El modelo usa técnicas de Procesamiento de Lenguaje Natural (un etiquetador de categorías gramaticales –POS tagger–, un analizador sintáctico parcial y un módulo para la resolución de la anáfora) para mejorar la precisión de los sistemas tradicionales de Recuperación de Información; para ello, se realiza una indexación de las “entidades” y las “relaciones” entre estas entidades en los documentos. Para la evaluación del modelo se ha utilizado los corpus CLEF en español e inglés. Para las preguntas en inglés, se ha obtenido una mejora de 35,11% en la precisión media. Para las preguntas en español, el aumento máximo es de 37,18%. In this paper, a novel model for monolingual Information Retrieval in English and Spanish language is proposed. This model uses Natural Language Processing techniques (a POStagger, a Partial Parser, and an Anaphora Resolver) in order to improve the precision of traditional IR systems, by means of indexing the “entities” and the “relations” between these entities in the documents. This model is evaluated on the Spanish and English CLEF corpora. For the English queries, there is a maximum increase of 35.11% in the average precision. For the Spanish queries, the maximum increase is 37.18%.
Details
- Database :
- OpenAIRE
- Journal :
- RUA. Repositorio Institucional de la Universidad de Alicante, Universidad de Alicante (UA)
- Accession number :
- edsair.dedup.wf.001..ad15ab8d65fd0467ab480b8b20d92906