Measuring the Impact and Effectiveness of Transitioning to a Linked Data Vocabulary

Measuring the Impact and Effectiveness of Transitioning to a Linked Data Vocabulary
19 de Octubre de 2016

Erik Radio, Scott Hanrath

Journal of library metadata, ISSN 1937-5034, Vol. 16, n. 2, 2016, p. 80-94

Los repositorios institucionales (RI) son cada vez más presenciales en las colecciones digitales de las instituciones universitarias, gracias a la inclusión de nuevos contenidos digitales mediante el auto-archivo. Los metadatos empleados para la búsqueda y localización de tales contenidos se consideran en ocasiones como de calidad insuficiente, fundamentalmente por el uso incorrecto de los términos y la falta de control de autoridades. Esto se hace más visible cuando los metadatos son creados por los propios autores, en lugar de por los catalogadores. Se busca paliar este problema mediante el uso de un vocabulario de datos enlazados (LD), al considerarse que se mejora la calidad de los datos y se ofrece una mayor visualización de los recursos. Los autores de este artículo describen la transición hacia un vocabulario LD de los metadatos existentes en el Repositorio Institucional de la Universidad de Kansas, KU Scholarworks (KUSW), y su impacto en la búsqueda y recuperación de recursos.

La transición contempla dos etapas, el empleo de OCLC’s Faceted Application of Subject Terminology (FAST), vocabulario basado en el Library of Congress Subject Headings (LCSH), cuyos términos de materia incluyen un URI, que permite la publicación de los metadatos de recursos en LD; y la transición a LD mediante la reconversión a RDF de los metadatos Dublin Core (DC), esquema predeterminado para recursos en KUSW.  Se lleva a cabo una prueba sobre un conjunto de registros para verificar su eficacia. Se seleccionan 35 registros de cada una de las áreas temáticas de Antropología y de Escuela de Negocios, y 33 de Geología - términos de materia diferentes entre sí - y se introducen en la herramienta FAST para buscar coincidencias con el vocabulario existente. Coincidencias que se agrupan en los siguientes campos: una coincidencia exacta, una coincidencia imprecisa, varias coincidencias, una coincidencia no clara o inexacta, y ninguna coincidencia clara. Los resultados se muestran en diversas tablas y figuras; y se destaca por parte de los autores que para cada disciplina existen términos que no tienen ni ninguna coincidencia, ni equivalencia, ni término relacionado, ni están incluidos en lo sugeridos por FAST; si bien, hay términos que son válidos para un término equivalente FAST los cuales se sugieren como tales y por tanto utilizables. No obstante lo anterior, se destaca por parte de los autores que las pruebas de FAST como vocabulario no se ajustan bien a dos de las tres colecciones de prueba, además de verificar que transicionar metadatos a LD es una tarea complicada cuando dichos metadatos son legados.

 

Resumen elaborado por la Sección de Documentación Bibliotecaria

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.