De la biblioteca digital a los conjuntos de datos abiertos

De la biblioteca digital a los conjuntos de datos abiertos
15 de Abril de 2020

 

From Ditital Library to Open Datasets

 

Rachel Wittmann, y otros

Information Technologies and Libraries, ISSN 2163-5226, Vol. 38, n. 4, 2019, p. 49-61

Durante décadas, las bibliotecas de investigación académicas han digitalizado y gestionado sistemáticamente las colecciones en línea con el propósito de poner los objetos de patrimonio cultural a disposición de un público más amplio.

El hacer que el contenido pueda ser buscado y accesible en línea ha sido revolucionario para la democratización de la investigación, pero el uso de colecciones digitalizadas ha imitado el uso tradicional: los investigadores clican en el texto, imágenes, mapas o documento históricos de uno en uno buscando una comprensión más profunda. Las “colecciones como datos” es un movimiento en crecimiento para extender el valor de la búsqueda de colecciones digitales más allá del uso tradicional, dando a los investigadores un acceso más flexible a las colecciones al facilitar el acceso a datos subyacentes. Las colecciones como datos tienen la cobertura de dos tendencias académicas que se han desarrollado paralelamente en las últimas dos décadas, la digitalización de una parte significativa de las colecciones especiales y el empleo de métodos computacionales como la minería de textos, los temas personalizados, los sistemas de información geográfica, etc. Ganar acceso a datos de mayor calidad es clave en el trabajo en humanidades, ya que sus objetos de estudios no están siempre tan disponibles como los datos de ciencias, que suelen ser numéricos, mientras que en humanidades son textos e imágenes. Estos datos no han sido bien proporcionados por las plataformas bibliotecarias o sus protocolos. Los métodos actuales de acceso incluyen contactar con la biblioteca o “raspar” datos de sus páginas web. Recientes esfuerzos como el del Institute of Museum and Library Services (IMLS’s), Always Already Computational y la Andrew W. Mellon Foundation buscan solucionar este problema estableciendo estándares y buenas prácticas para convertir las colecciones digitales en conjuntos de datos disponibles para el uso computacional y nuevos métodos de búsqueda. Este artículo se centra en la experiencia de la University of Utah en el desarrollo de una estrategia y un programa piloto de colecciones como datos.

Resumen elaborado por Antonio Rodríguez Vela

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.