Back to Search Start Over

Extracción automática de metadatos como soporte para el autoarchivo de objetos digitales en repositorios

Authors :
Ana Casali
Cristina Bender
Claudia Deco
Santiago Fontanarrosa
Source :
Revista Colombiana de Computación, Vol 15, Iss 2 (2014), Revista Colombiana de Computación, Vol 15, Iss 2, Pp 135-160 (2014), Revista Colombiana de Computación; Vol. 15 Núm. 2 (2014): Revista Colombiana de Computación; 135-160, Repositorio UNAB, Universidad Autónoma de Bucaramanga-UNAB, instacron:Universidad Autónoma de Bucaramanga-UNAB, Revista Colombiana de Computación, Vol 15, Iss 2, Pp 135-160 (2018)
Publication Year :
2014
Publisher :
Universidad Autónoma de Bucaramanga, 2014.

Abstract

En este trabajo se propone facilitar al usuario el autoarchivo de sus objetos digitales educativos en un repositorio institucional. Para esto, se modifica el flujo de carga estándar de la plataforma DSpace, proponiendo un nuevo flujo para el depósito de objetos de modo que pueda integrarse en este proceso un extractor de metadatos. Se presenta una arquitectura abierta de un módulo extractor automático de algunos metadatos de los documentos. Estos metadatos extraídos automáticamente son luego validados por el usuario en el proceso de descripción del objeto. Para diseñar el extractor se analizaron distintas herramientas de extracción y se optó por la combinación que arrojó mejores resultados. Este módulo se ha diseñado de modo de poder integrar otras herramientas extractoras. Se ha desarrollado un prototipo en JAVA de este asistente y se ha experimentado sobre dos corpus de documentos, uno en idioma Inglés y otro en idioma Español. En este trabajo, se presentan resultados de la extracción automática de los metadatos Palabras clave, Título y Autores, endocumentos en ambos idiomas, los cuales resultan promisorios. Mediante este asistente se espera ayudar al usuario en el proceso de carga de objetos digitales educativos disminuyendo así su trabajo, y mejorando la cantidad y la calidad de los metadatos cargados.

Details

Language :
English
ISSN :
25392115 and 16572831
Volume :
15
Issue :
2
Database :
OpenAIRE
Journal :
Revista Colombiana de Computación
Accession number :
edsair.dedup.wf.001..9216e9a19da0e400c0873067f2fd578b