Back to Search
Start Over
Extracción automática de metadatos como soporte para el autoarchivo de objetos digitales en repositorios
- Source :
- Revista Colombiana de Computación, Vol 15, Iss 2 (2014), Revista Colombiana de Computación, Vol 15, Iss 2, Pp 135-160 (2014), Revista Colombiana de Computación; Vol. 15 Núm. 2 (2014): Revista Colombiana de Computación; 135-160, Repositorio UNAB, Universidad Autónoma de Bucaramanga-UNAB, instacron:Universidad Autónoma de Bucaramanga-UNAB, Revista Colombiana de Computación, Vol 15, Iss 2, Pp 135-160 (2018)
- Publication Year :
- 2014
- Publisher :
- Universidad Autónoma de Bucaramanga, 2014.
-
Abstract
- En este trabajo se propone facilitar al usuario el autoarchivo de sus objetos digitales educativos en un repositorio institucional. Para esto, se modifica el flujo de carga estándar de la plataforma DSpace, proponiendo un nuevo flujo para el depósito de objetos de modo que pueda integrarse en este proceso un extractor de metadatos. Se presenta una arquitectura abierta de un módulo extractor automático de algunos metadatos de los documentos. Estos metadatos extraídos automáticamente son luego validados por el usuario en el proceso de descripción del objeto. Para diseñar el extractor se analizaron distintas herramientas de extracción y se optó por la combinación que arrojó mejores resultados. Este módulo se ha diseñado de modo de poder integrar otras herramientas extractoras. Se ha desarrollado un prototipo en JAVA de este asistente y se ha experimentado sobre dos corpus de documentos, uno en idioma Inglés y otro en idioma Español. En este trabajo, se presentan resultados de la extracción automática de los metadatos Palabras clave, Título y Autores, endocumentos en ambos idiomas, los cuales resultan promisorios. Mediante este asistente se espera ayudar al usuario en el proceso de carga de objetos digitales educativos disminuyendo así su trabajo, y mejorando la cantidad y la calidad de los metadatos cargados.
- Subjects :
- Desarrollo de tecnología
lcsh:Computer engineering. Computer hardware
Tecnologías de la información y las comunicaciones
Investigaciones
Extracción automática de metadatos
Flujo de carga
Innovaciones tecnológicas
Ciencia de los computadores
Technology development
lcsh:TK7885-7895
Information and communication technologies
Investigations
Objetos digitales educativos
Ingeniería de sistemas
Computer science
lcsh:QA75.5-76.95
Systems engineering
ICT's
TIC´s
Technological innovations
lcsh:Electronic computers. Computer science
Repositorios
Subjects
Details
- Language :
- English
- ISSN :
- 25392115 and 16572831
- Volume :
- 15
- Issue :
- 2
- Database :
- OpenAIRE
- Journal :
- Revista Colombiana de Computación
- Accession number :
- edsair.dedup.wf.001..9216e9a19da0e400c0873067f2fd578b