Extracción automática de metadatos como soporte para el autoarchivo de objetos digitales en repositorios

  • Ana Casali Universidad Nacional de Rosario
  • Cristina Bender Universidad Nacional de Rosario
  • Claudia Deco Universidad Nacional de Rosario
  • Santiago Fontanarrosa Universidad Nacional de Rosario

Resumen

En este trabajo se propone facilitar al usuario el autoarchivo de sus objetos digitales educativos en un repositorio institucional. Para esto, se modifica el flujo de carga estándar de la plataforma DSpace, proponiendo un nuevo flujo para el depósito de objetos de modo que pueda integrarse en este proceso un extractor de metadatos. Se presenta una arquitectura abierta de un módulo extractor automático de algunos metadatos de los documentos. Estos metadatos extraídos automáticamente son luego validados por el usuario en el proceso de descripción del objeto. Para diseñar el extractor se analizaron distintas herramientas de extracción y se optó por la combinación que arrojó mejores resultados. Este módulo se ha diseñado de modo de poder integrar otras herramientas extractoras. Se ha desarrollado un prototipo en JAVA de este asistente y se ha experimentado sobre dos corpus de documentos, uno en idioma Inglés y otro en idioma Español. En este trabajo, se presentan resultados de la extracción automática de los metadatos Palabras clave, Título y Autores, en documentos en ambos idiomas, los cuales resultan promisorios. Mediante este asistente se espera ayudar al usuario en el proceso de carga de objetos digitales educativos disminuyendo así su trabajo, y mejorando la cantidad y la calidad de los metadatos cargados.
Cómo citar
Casali, A., Bender, C., Deco, C., & Fontanarrosa, S. (2014). Extracción automática de metadatos como soporte para el autoarchivo de objetos digitales en repositorios. Revista Colombiana De Computación, 15(2), 135–160. Recuperado a partir de https://revistas.unab.edu.co/index.php/rcc/article/view/2490

Descargas

Los datos de descargas todavía no están disponibles.
Publicado
2014-12-01
Sección
Artículo de investigación científica y tecnológica

Métricas

QR Code
Crossref Cited-by logo