Datos.bne.es: un año de datos bibliográficos en la nube
En noviembre de 2014 se lanzó al público el portal datos.bne.es, un acercamiento distinto y una visualización novedosa de la inmensa cantidad de datos bibliográficos que existen en la Biblioteca Nacional de España. No solamente los datos sobre sus colecciones, las piezas que atesora en sus depósitos, sino también sus datos de autores y su vocabulario controlado para las materias, todos ellos producto del trabajo de varias generaciones de bibliotecarios.
Una de las aportaciones más destacadas que este portal ha supuesto es la mayor presencia en Internet de todo este conjunto de datos. Esto es así porque este portal está construido según las tecnologías y buenas prácticas de la Web Semántica en general y de Linked Open Data en particular, cuya finalidad última, como dice la oficina española del W3C en su Guía breve a la Web Semántica , es un Internet en el que el usuario “podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información mejor definida.”
Los usuarios que han llegado a nuestras páginas directamente desde los buscadores, y las preguntas y peticiones que sobre nuestros fondos han formulado nos han suministrado una información única y valiosa sobre qué parte de nuestras colecciones le interesa a esa masa de usuarios desconocidos allí fuera de nuestros muros. Los resultados han sido, cuanto menos, sorprendentes.
De un catálogo oculto a un catálogo abierto
Motor de búsqueda de Google
Los catálogos de las bibliotecas, conocidos aún en la jerga profesional como OPACs (Online Public Access Catalogues), tienen en general, en el ecosistema de datos que significa Internet, un comportamiento a posteriori; son un receptáculo pasivo, una base de datos a la espera de que un usuario entre en la página web de una biblioteca y acceda al catálogo. Muchas son las voces de los profesionales que alertan de que éste es un comportamiento peligroso para el futuro y la persistencia de las bibliotecas, en lucha con otras fuentes de información más inmediatas en la nube. Los buscadores, con Google a la cabeza, son la biblioteca de referencia de la actualidad, ese sitio ubicuo que no solamente nos sirve para reservar unas vacaciones o comprar una lavadora, sino que también cada vez más son el punto de partida para la investigación especializada, para la cultura, la información, la actividad creativa y empresarial, para el conocimiento en suma. Las bibliotecas tienen que estar ahí, y este primer año de datos.bne.es es una pequeña gran prueba de ello.
Una de las premisas básicas de Linked Open Data es que todos los recursos tengan una dirección web http fija y permanente, de modo que los buscadores y rastreadores puedan localizar su contenido. Éste debe estar además descrito y estructurado, como si de una base de datos se tratase, de modo que se facilite su procesamiento. El estándar marco utilizado para ello en Web Semántica es RDF (Resource Description Framework). Si se cumplen estos requisitos, puede ocurrir que una búsqueda precisa de un usuario pueda ofrecer un enlace directo a un recurso de la Biblioteca.
Qué nos deja la marea
El príncipe Mitsuuji en el río Oigawa [Material gráfico] : Mitsuuji Oigawa yuran no zuNo nos interesan para este examen los registros de logs que nos informan de los términos de búsqueda introducidos por el visitante a datos.bne.es, o las estadísticas de acceso que nos brindan las aplicaciones analíticas; queremos saber qué andaban buscando esos usuarios inesperados en sus navegadores cuando aterrizaron sin quererlo y sin saberlo en nuestra Biblioteca. Queremos saber cuáles de nuestros fondos se han hecho de pronto visibles al resto del mundo, y la mejor manera que tenemos de acercarnos son los correos y las consultas que nos llegan al buzón de datos.bne.es; esto es, lo que nos deja la marea.
Para nuestra sorpresa no han sido los fondos más antiguos, ni los valiosos, ni los de escritores consagrados los que han cobrado relevancia con esta aventura. La mayor parte de las consultas, relativas a cómo acceder a los fondos de la Biblioteca, han sido sobre materiales descatalogados, imposibles de encontrar, en un arco sobre todo que va de los años 50 hasta los 90, ediciones en general de escasa tirada, probablemente ese tipo de cosas que un ciudadano no se atreve a pedir en una biblioteca nacional o que quizá ni sospeche que puedan estar aquí: manuales olvidados, materiales divulgativos, mucha música, partituras o grabaciones de grupos poco conocidos, coros, o bien fotografías o estampas de difícil localización, viejas películas en VHS. Alguna historia especialmente curiosa, como personas que reconocen a antecesores suyos y que quieren recuperar para ellos una desconocida producción literaria, empresas o fundaciones que piden su propio material antiguo que ya no conservan, intérpretes de grabaciones o películas que piden copias de su propio trabajo, de las que ya quedan copias en sus productoras o editoras…
Cuidado con lo que deseas
No todo han sido finales felices en esta exposición a Internet. Hay casos relativamente frecuentes de sobreexposición: autores que no quieren figurar (sin darse cuenta de que esos datos llevan muchos años en el catálogo), que no quieren encontrarse en Internet, deseosos de anonimato, autores que desean renegar de su producción, fondos que salen a la luz indebidamente, antes de tiempo, aún en proceso, no disponibles.
Conclusiones
La publicación de datos bibliográficos en abierto, localizables, siguiendo las mejoras prácticas de Linked Open Data, aún está en nuestro caso en estado embrionario, con mucho campo inexplorado por delante y mucho por mejorar. Pero estos primeros pasos han sido sorprendentes y positivos, poniendo en valor esa gran cantidad de recursos de la Biblioteca poco conocidos.
Datos.bne.es sale al encuentro del usuario, lo trae a la biblioteca; de hecho, convierte en usuarios a ciudadanos que no lo son ni sospechan que puedan serlo. Y no solo al ciudadano erudito o al investigador, sino también al ciudadano medio, al curioso.
Por otra parte, datos.bne.es rentabiliza el trabajo del bibliotecario, multiplica y añade valor a los datos que se recogen, los lanza fuera de la Biblioteca a que encuentren a su usuario.
Unas reflexiones muy interesantes