Vocabularios para la publicación de datos de investigación
Vocabularies for publishing research data
Kazumi Tomoyose & Ana Carolina Simionato Arakaki
Cataloging & classification quarterly, ISSN 1544-4554, Vol. 60, n. 1, 2022, p. 69-85
Los datos de investigación son esenciales para el desarrollo de la ciencia, y uno de los problemas que deben tratarse es su organización y representación. Basándose en los conceptos básicos de la Ciencia de la Información, se busca explorar el Data Catalog Vocabulary (DCAT) y los vocabularios usados por él en el contexto de la publicación de datos de investigación.
DCAT es un vocabulario RDF diseñado para facilitar la interoperabilidad entre catálogos de datos publicados en la web que permite a los editores tener una herramienta normalizada que facilita el uso y agregación de metadatos de múltiples catálogos. Se asegura que el uso de vocabularios de metadatos para representar los datos de investigación es necesario para mejorar el acceso, la posibilidad de encontrarlos, la interoperabilidad y la recuperación de conjuntos de datos. Se verifica que DCAT permite la normalización de los catálogos y de los conjuntos de datos a través de términos específicos para este propósito, presentándose como un vocabulario adecuado para representar los datos de investigación. A través de términos como dcat:dataset, dcat:service, y dcat:catalog, cuyo objetivo es la normalización de conjuntos de datos en general, DCAT puede recudir problemas como la ambigüedad, ayudando a descubrir datos y servicios de datos. Además, DCAT puede aplicarse a diferentes áreas de conocimiento. Sin embargo, hay algunas disciplinas y recursos que requieren una mayor especificación y términos que no son parte de DCAT, lo que puede llevar a investigadores y plataformas a adherirse a otros vocabularios más específicos. En este caso, se puede desarrollar o adoptar un perfil DCAT para salvar este obstáculo. Por otra parte, DCAT favorece el enlazado de datos relacionados, incrementando el potencial para el descubrimiento de la información. Es importante subrayar que los profesionales de la información son unos de los más capacitados para llevar a cabo el proceso de representación de los datos de investigación, ya que tienen los conocimientos y técnicas necesarias para proporcionar el mejor acceso y recuperación de datos relevantes para las necesidades de los usuarios. Se sugiere que futuras investigaciones exploren el uso efectivo de DCAT en repositorios de datos para la representación de datos de investigación, permitiendo una evaluación y verificación de su impacto en la recuperación de la información.
https://www.tandfonline.com/doi/full/10.1080/01639374.2021.2011812