Back to Search Start Over

UnderRL Tagger: un etiquetador gramatical para lenguas infrasoportadas tecnológicamente y lenguas minoritarias

Authors :
José Luis Pemberty Tamayo
Jorge Mauricio Molina Mejía
Víctor Julián Vallejo Zapata
Source :
Forma y Función, Vol 36, Iss 2 (2023)
Publication Year :
2023
Publisher :
Universidad Nacional de Colombia, 2023.

Abstract

En este artículo se presenta UnderRL Tagger, un programa informático de acceso libre diseñado para el etiquetado morfosintáctico (POS tagging) en lenguas que no cuentan con etiquetadores automáticos. El programa busca facilitar el trabajo con corpus en estas lenguas infrasoportadas tecnológicamente y en las lenguas minoritarias, aportando así a los procesos de revitalización desde la investigación descriptiva y las herramientas computacionales. UnderRL Tagger permite que el proceso manual de etiquetado se convierta poco a poco en automático gracias a un sistema que permite recordar y reutilizar las etiquetas, manejar grandes cantidades de textos y generar archivos de salida en formato XML con etiquetas basadas en el sistema estandarizado EAGLES. Este artículo muestra el proceso de modelado y elaboración del sistema, sus diferentes funcionalidades y las perspectivas de trabajos posteriores.

Details

Language :
English, Spanish; Castilian, Portuguese
ISSN :
0120338X and 22565469
Volume :
36
Issue :
2
Database :
Directory of Open Access Journals
Journal :
Forma y Función
Publication Type :
Academic Journal
Accession number :
edsdoj.8a1ddd5a38b0456c8de054f7fcd41cce
Document Type :
article
Full Text :
https://doi.org/10.15446/fyf.v36n2.101984