Back to Search Start Over

Uso de Internet para aumentar la cobertura de un sistema de adquisición léxica para el ruso

Authors :
Oliver González, Antoni
Castellón Masalles, Irene
Màrquez Villodre, Lluís
Universitat Oberta de Catalunya. Internet Interdisciplinary Institute (IN3)
Universitat de Barcelona
Universitat Politècnica de Catalunya
Source :
O2, repositorio institucional de la UOC, Universitat Oberta de Catalunya (UOC)
Publication Year :
2003
Publisher :
Procesamiento del lenguaje natural, 2003.

Abstract

En este artículo presentamos una metodología para la adquisición de recursos léxicos a partir de corpus sin anotar. Esta metodología está demostrando ser de una gran eficacia para lenguas que, como el ruso, presentan una morfología rica y de tipo predominantemente concatenativa. La metodología puede aplicarse tanto a la creación de nuevos recursos léxicos como en la ampliación de recursos léxicos ya existentes. Presentamos asimismo una extensión de la metodología que realiza consultas automáticas a Internet para adquirir aquellas entradas para las cuales no existe suficiente información en nuestro corpus. This paper presents a methodology for the automatic acquisition of lexical resources from raw corpora. This methodology has proved to be efficient for those languages that, like Russian, present a rich and mainly concatenative morphology. This method can be applied in the creation of new resources, as well as in the enrichment of existing resources. We also present an extension of the system that uses automatic querying to Internet to acquire those entries for which we have not enough information in our corpus.

Details

Language :
English
Database :
OpenAIRE
Journal :
O2, repositorio institucional de la UOC, Universitat Oberta de Catalunya (UOC)
Accession number :
edsair.dedup.wf.001..b11d08035aac46dd9ebd4def32de3365