Datos enlazados: qué son y para qué sirven
Igual que las obras impresas se relacionan entre sí a través de las notas y de las bibliografías, los documentos electrónicos disponibles en la web pueden enlazarse mediante enlaces o hipervínculos.
Cuando al principio de los años 90 el fenómeno estalló sobre nuestras desprevenidas cabezas, ante nosotros se abrió todo un mundo de posibilidades, que luego irían mostrando su cara menos amable: infinidad de documentos relacionados entre sí y una recuperación bastante burda pasaban a complicar, más que a facilitar, el acceso a la información y a través de ésta al conocimiento.
Hace ya 5 años, Tim Berners-Lee presentó el concepto de linked data, que en España ha sido traducido por datos vinculados o datos enlazados. El concepto se inscribe dentro de la estructura general de lo que se ha dado en llamar web semántica, es decir una web que permita la navegación por ella no a través de la acción de las personas, sino a través de “sistemas y agentes software [que] pueden explotar estos datos de forma automática” *.
Como siempre que emerge un nuevo concepto, nuestra visión es aún poco definida, pero empezamos a imaginar una web totalmente diferente, con mucho más sentido y con mucha más eficacia. Ahora las relaciones se establecen no entre documentos, sino entre datos concretos. Para conseguir que los agentes de software (en último término, máquinas) “entiendan” los términos y, por tanto, puedan seguir las relaciones que los conectan, estos términos deben establecerse como vocabularios y ontologías, y debe hacerse mediante RDF o Resource Description Framework. La consulta de estos datos debe usar también un lenguaje especial, el SPARQL.
Pero sobre todo, debe usar URIs (Uniform Resource Identifier) para crear nombres únicos para los recursos y, mediante el protocolo HTTP, nombrar y resolver la ubicación de los datos identificados mediante esas URIs, y de este modo enlazar con otros recursos semejantes. Tim Berners-Lee ha creado el concepto de Datos 5 estrellas, y para divulgar estos requisitos los ha impreso en una taza :
A partir de esta teorización, las realizaciones prácticas empiezan a ser abundantes. La más conocida quizás sea GeoLinkedData, pero como señala Asunción Gómez Pérez, del Ontology Engineering Group de la Universidad Politécnica de Madrid, las iniciativas abarcan ámbitos diferentes, como son los medios de comunicación, las bibliotecas, la investigación científica y los proyectos internacionales de I+D+i.
En el sector público se está revelando como un modo de reutilizar datos públicos y favorecer el aprovechamiento de estos de una manera más extensa. Por ejemplo, el Reino Unido ha creado un Instituto de investigación liderado por Tim Berners-Lee que ya ha elaborado varios catálogos de datos públicos.
En el ámbito bibliotecario son ya bastantes las instituciones que han respondido al reto de conectar sus datos; entre otras podemos mencionar la Biblioteca Nacional Alemana, que ya ha vertido gran parte de su catálogo RDF. En la Biblioteca Nacional de España acabamos de firmar un acuerdo marco con la Universidad Politécnica para comenzar las tareas que conduzcan a un enlazado de nuestros datos, comenzando con los registros de autoridad de nombres de personas para vincular las distintas versiones de estos nombres en las distintas lenguas oficiales. Se trata de un proyecto modesto pero que pretende ser el punto de partida para proyectos más ambiciosos.
Enlazar datos de este modo nos permitirá no sólo la reutilización de estos, sino incluso la creación de nuevas conexiones entre diversos conceptos y su explotación más eficaz, ayudándonos a generar una inteligencia compartida entre muchos.
* Apúntate al reto de los datos enlazados, de Asunción Gómez Pérez. En madri+d : un lugar para la ciencia y la tecnología, 25/05/2010 [Disponible en: http://www.madrimasd.org/informacionIdi/analisis/analisis/analisis.asp?id=44078#nota1 , Consultado: 26-02-2011]
Me ha parecido muy interesante, eso que yo soy novata en esto de los ordenadores.