Back to Search
Start Over
Uso de Internet para aumentar la cobertura de un sistema de adquisición léxica para el ruso
- Source :
- O2, repositorio institucional de la UOC, Universitat Oberta de Catalunya (UOC)
- Publication Year :
- 2003
- Publisher :
- Procesamiento del lenguaje natural, 2003.
-
Abstract
- En este artículo presentamos una metodología para la adquisición de recursos léxicos a partir de corpus sin anotar. Esta metodología está demostrando ser de una gran eficacia para lenguas que, como el ruso, presentan una morfología rica y de tipo predominantemente concatenativa. La metodología puede aplicarse tanto a la creación de nuevos recursos léxicos como en la ampliación de recursos léxicos ya existentes. Presentamos asimismo una extensión de la metodología que realiza consultas automáticas a Internet para adquirir aquellas entradas para las cuales no existe suficiente información en nuestro corpus. This paper presents a methodology for the automatic acquisition of lexical resources from raw corpora. This methodology has proved to be efficient for those languages that, like Russian, present a rich and mainly concatenative morphology. This method can be applied in the creation of new resources, as well as in the enrichment of existing resources. We also present an extension of the system that uses automatic querying to Internet to acquire those entries for which we have not enough information in our corpus.
Details
- Language :
- English
- Database :
- OpenAIRE
- Journal :
- O2, repositorio institucional de la UOC, Universitat Oberta de Catalunya (UOC)
- Accession number :
- edsair.dedup.wf.001..b11d08035aac46dd9ebd4def32de3365