Salvar las distancias: usar datos enlazados para mejorar el descubirmiento y la diversidad en colecciones digitales

Salvar las distancias: usar datos enlazados para mejorar el descubirmiento y la diversidad en colecciones digitales
25 de Mayo de 2022

Bridging the gap: using linked data to improve discoverability and diversity in digital collections

 

Jason Bocza, y otros

Information technology and libraries, ISSN 2163-5226, Vol. 40, n. 4, 2021

Este artículo comparte impresiones sobre el uso de la tecnología de los datos enlazados para proporcionar un fácil acceso a colecciones de patrimonio cultural, no solo a comunidades académicas sino a cualquier interesado.

Los datos enlazados permiten aumentar el acceso y el descubrimiento, ya que su sistema de tripletes hace más sencillo la transferencia de datos entre diferentes esquemas, y también facilitan el almacenamiento de metadatos y su importación a gran escala. Una de las grandes ventajas de los datos enlazados es la posibilidad de crear conexiones entre colecciones de patrimonio cultural de todo el mundo a través de la web. La biblioteca de la University of South Florida (USF) posee una gran colección digital que quiere compartir con el mayor número de personas posible. Al digitalizar esta colección, se tuvo cuidado en analizarla para determinar cómo sería posible enriquecerla con la mayor cantidad de datos posibles. Los autores diseñaron un esquema de metadatos que combinaba MODS y Darwin Core. El siguiente paso fue añadir URIs, para lo que era necesario normalizar los datos y confrontarlos con estándares de autoridades muy extendidos, como los encabezamientos de materias de la Library of Congress, wikidata y el tesauro Getty. Se dedicó un esfuerzo extra en dotar los objetos de metadatos sobre localización. La USF se asoció con la Digital Public Library of America (DPLA) para aumentar la facilidad en el descubrimiento. Para completar el proceso de migración hacia una colección de datos enlazados, se usó el DPLA Metadata Application Profile como modelo de datos en un proyecto piloto. En este proyecto, se examinaron los campos de metadatos MODS/METS y se identificaron aquellos que tuvieran sentido en el nuevo esquema de metadatos. Después se pasaron esos metadatos a un archivo de Excel, que se revisó usando OpenRefine para cotejar estos datos y elegir URIs para los términos exactos. También se cotejaron los datos con los obtenidos a través de la Library of Congress, Getty TGN, and Wikidata. Cuando todos los metadatos están normalizados, se transforman los archivos de Excel en tripletes. Después se almacenan estos tripletes en Apache Jena y así se puede empezar a utilizar SPARQL para facilitar la búsqueda. El último paso es diseñar una interfaz amigable para optimizar la experiencia de los usuarios.

https://ejournals.bc.edu/index.php/ital/article/view/13063

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.