Control de Autoridades vs Gestión de Identidades

Control de Autoridades vs Gestión de Identidades
31 de Marzo de 2016

Sí, confieso. Voy a hablar de un tema de esos para bibliotecarios, aburrido para los ajenos, con la típica jerga profesional que espanta a los no iniciados. Intentaré hacerlo de la forma más clara posible. ¿Amena? Quizás sea demasiado pedir. Pero si continúan leyendo, no digan que no les advertí.

¿Control de autoridades?

Arresto

¿Control de autoridades? se preguntarán. Nada que ver el tema con la fotografía.

Los bibliotecarios que nos dedicamos a describir los recursos de nuestras instituciones (libros, mapas, revistas, fotografías, películas, partituras y un larguísimo etcétera) para que nuestros usuarios puedan encontrar aquello que buscan en nuestros catálogos, nos encontramos habitualmente con el problema de identificar de forma correcta tanto a sus autores como las materias o conceptos sobre los que tratan, las imágenes que representan, la fecha en la que fueron creados o la institución responsable de su publicación. La dificultad estriba en que demasiadas “cosas” se denominan de la misma manera y resulta difícil diferenciarlas y saber en cada momento de quién o de qué estamos hablando.

Tenemos nuestros trucos, no se crean. Por ejemplo, jugamos con fechas de nacimiento (y muerte, en su caso), o con la profesión, para diferenciar unos autores de otros que tienen el mismo nombre, o definimos entre paréntesis el ámbito de aplicación de un concepto. A todo este trabajo lo denominamos en nuestro argot, “control de autoridades” y, a su resultado, “catálogo de autoridades”. Aquí, por ejemplo, les dejo el enlace al nuestro, el de la Biblioteca Nacional de España por si les pica la curiosidad y quieren echarle un vistazo: http://catalogo.bne.es/uhtbin/authoritybrowse.cgi.

Rosas y espinas

Les puedo asegurar que realizar este trabajo no es un camino de rosas. Hay ocasiones en que algún autor se nos queja, con razón, de que nos hemos equivocado y de que aunque se llama “Fulanito Pérez” no es el mismo “Fulanito Pérez” que escribe novelas de misterio, ya que él se dedica a la física nuclear y, sin embargo, hemos atribuido al novelista una de sus obras. Si, además, nuestro “Fulanito Pérez” científico depende de que en nuestros catálogos bibliotecarios aparezcan correctamente asignadas sus obras a su nombre para que le evalúen como profesional de la ciencia, imagínense el lío. Si encima como resultado de nuestra participación en proyectos internacionales como VIAF ese error acaba extendiéndose a otros catálogos de bibliotecas internacionales, el embrollo crece.

En nuestro descargo, he de decir, en primer lugar, que se trata siempre de errores involuntarios – errar es de humanos y nosotros, pobres bibliotecarios, lo somos – y, en segundo lugar, que hacemos todo lo que está en nuestra mano cuando se produce una situación como ésta para corregir el error en nuestro catálogo y en todos aquellos en los que descubramos que se haya replicado.

Redundancias

Como imaginarán, en las bibliotecas siempre hemos estado liados y hemos lidiado con la identidad de las personas, las entidades, los conceptos, las fechas, los lugares y muchas ‘cosas’ más. Y no solo en bibliotecas, sino en otras instituciones como archivos y museos. No hay nada más que echar un vistazo, por ejemplo, a la norma EAC-CPF, utilizada en los archivos para describir personas, instituciones y familias, para comprobar como un concepto básico en ella es el de “identidades” (individuales, múltiples, alternativas, colaborativas).

Crisis de identidad

El problema es que repetimos el mismo proceso una y otra vez en cada institución, lo que no parece muy eficaz, aunque solo sea desde una perspectiva económica y de gestión de recursos. Además, que, por ejemplo, en la BNE prefiramos denominar “Don Quijote de la Mancha” a la obra cervantina más universal y no “Don Quixote”, como la conocen en el ámbito anglosajón, no debería ser un obstáculo para que pudiéramos realizar este trabajo de una forma más colaborativa. En este sentido, el proyecto internacional VIAF (Fichero de Autoridades Virtual Internacional) ha demostrado que la colaboración es posible, reduce costes y multiplica el impacto del trabajo de cada una de las bibliotecas nacionales que participan en él.

¡Bendita tecnología!

Old computer

Y si esto es posible es gracias a la tecnología que nos permite enlazar los datos que almacenamos en nuestros catálogos con otros conjuntos de datos que los enriquecen con su información (una versión avanzada de los "cerebros electrónicos" de la imagen, claro). Este método de publicación de datos conocido como “datos enlazados” es una de las bases de la Web semántica que pretende que no solo los humanos seamos capaces de "leer" estos datos e interpretarlos, sino que también lo puedan hacer las máquinas. Y si Deep Blue pudo ganar allá por el año 1996 al campeón del mundo de ajedrez Gary Kaspárov, imagínense de lo que podrían ser capaces ahora si las dejamos.

Hasta ahora, además, los bibliotecarios hemos vivido muy ensimismados en alimentar nuestros propios catálogos, sin pensar demasiado quizás en que debemos salir al espacio exterior, la web, para exponer nuestros datos allí donde nuestros conciudadanos buscan información, sean o no usuarios de bibliotecas. A medida que nos movemos hacia ese entorno de datos enlazados, y en la BNE estamos experimentando en este sentido con datos.bne.es, las tareas relacionadas con el control tradicional de autoridades se demuestran como más importantes, aunque probablemente hayan de volverse mucho más sofisticadas. Ya no va a ser suficiente con desambiguar homonimias sino que resultará imprescindible identificar unívocamente autores, obras, entidades, lugares, acontecimientos, etc., movernos desde el tradicional control de autoridades a la gestión de identidades.

[bctt tweet="'Los bibliotecarios debemos mostrar los datos en la web que es donde se busca la información' @mjmcalero" via="no"]

Identificadores para la Gestión de Identidades

Identidades

Gestión de identidades es el concepto que más se repite últimamente en foros profesionales internacionales en relación a estos temas y consiste en la utilización de identificadores unívocos para todas estas "cosas" de las que venimos hablando desde el inicio del post: autores literarios, académicos, entidades, conceptos, lugares, hechos históricos, familias, etc. Hasta ahora contábamos con identificadores tradicionales para determinados tipos de recursos como el ISBN, número de identificación para las ediciones de libros que tan útil ha resultado fundamentalmente para el mercado del libro, el ISSN para las revistas o el ISAN para recursos audiovisuales. Estos identificadores son numéricos. El avance respecto a ellos en relación a la web semántica es la necesidad de que los identificadores adopten la forma de URIs (Uniform Resource Identifiers).

Además de aquellos que identificaban tipos de recursos, en los últimos años han aparecido diferentes iniciativas para la definición de identificadores que establezcan de forma unívoca dicha identidad en el caso de autores, creadores o investigadores, como ORCID o ISNI, que se vienen a sumar a los tradicionales ficheros de autoridades mantenidos por las bibliotecas como el propio de la Library of Congress o VIAF, el Fichero de Autoridades Virtual Internacional.

La ventaja de los URIs es que permiten un nivel de precisión imposible de reproducir utilizando cadenas de caracteres. Y cuentan con la ventaja adicional de que pueden ser interpretados por las máquinas, con todo lo que ello implica para la generación de nuevo conocimiento y para el descubrimiento de recursos de forma automatizada.

[bctt tweet="'Necesitamos identificadores en forma de URIs para la gestión de identidades' @mjmcalero" via="no"]

Problemas y Desafíos

Pasar de teclear los nombres de las “cosas” – utilizar cadenas de caracteres como elemento de identificación en nuestra jerga bibliotecaria – a identificar esas ‘cosas’ mediante URIs, nos traslada a un escenario de trabajo completamente diferente al que estábamos acostumbrados hasta ahora. Tal y como se vislumbra ahora el panorama, parece que utilizaremos estos identificadores que o bien nosotros u otras instituciones desarrollen y que permitirán a nivel global que nadie confunda a nuestro “Fulanito Pérez” científico con cualesquiera otros “Fulanitos Pérez” que puedan existir, se dediquen a la novela de misterio, a la lingüística comparada o al cabaret. Es más, podremos cruzar nuestros propios datos con otros que los enriquezcan y nos lleven a descubrir otros recursos con los que no cuenta nuestra institución.

Claro que, en seguida, surgen las dudas. ¿Quién se va a encargar de llevar a cabo esta labor de creación, gestión y mantenimiento de “identidades” mediante URIs unívocas? ¿Son de confianza? ¿Podemos fiarnos de que su trabajo se mantendrá en el tiempo? Imaginen, por un momento, que ORCID, organización sin ánimo de lucro que se encarga de proporcionar estos identificadores a investigadores académicos de todo el mundo, deje de existir por cualquier razón – crucemos los dedos para que no pase. ¿Cuáles serían las implicaciones para el trabajo diario de instituciones como las bibliotecas que gestionan recursos producidos por la comunidad científica la desaparición de una entidad de estas características?

En la actualidad todavía no contamos con la tecnología adecuada para trabajar con estos identificadores, por lo que es demasiado pronto para predecir el impacto que tendrá sobre los procesos y flujos de trabajo actuales, pero es evidente que nos veremos obligados a cambiar nuestra forma de trabajar.

[bctt tweet="'Es pronto para predecir el impacto de los identificadores sobre el #controldeautoridades en bibliotecas' @mjmcalero" via="no"]

Como  Karen Smith-Yoshimura, de OCLC, señala en un post reciente el impacto de los identificadores sobre los flujos de trabajo actuales relacionados con el control de autoridades en bibliotecas dependerá de la utilización de herramientas que todavía no existen.

Comentarios

Miembro desde hace

4 años 2 meses
Nombre
Jaime
Apellidos
Olalla
Enlace permanente

Esperanza Jiménez Tirado

Estupendo artículo, María Jesús. Por aquí (UCO) andamos con el control de autoridades "tradicional", que ya es un tarea importante. Muchas gracias por iluminar el futuro un poco, a ver cuando llega.

Miembro desde hace

4 años 2 meses
Nombre
Jaime
Apellidos
Olalla
Enlace permanente

María Jesús Morillo

Muchas gracias, Esperanza. ¡Qué bueno leerte por aquí después de tanto tiempo! Me alegro de que te haya interesado. Un abrazo, María Jesús

Miembro desde hace

4 años 2 meses
Nombre
Jaime
Apellidos
Olalla
Enlace permanente

Manolo Pérez

Magnífico. Los URIs explicados muy claramente. La introducción que haces sobre el control de autoridades lleva a entender perfectamente qué son, qué pretenden y cuáles son las ventajas de los URIs. Además, los enlaces que ofreces son muy valiosos. Con tu permiso, lo comparto con otros colegas. Muchas gracias, Mª Jesús.

Miembro desde hace

4 años 2 meses
Nombre
Jaime
Apellidos
Olalla
Enlace permanente

María Jesús Morillo

Muchas gracias a ti, Manolo, por compartirlo. Me alegro de que te haya gustado. Un abrazo, María Jesús

Miembro desde hace

4 años 2 meses
Nombre
Jaime
Apellidos
Olalla
Enlace permanente

Marystella Maldonado Martinez

Excelente documento, para nosotros los catalogadores y ahora con el nuevo reto de RDA, los catalogadores y la catalogación esta de moda. Un abrazo Marystella Maldonado Valledupar (Colombia)

Miembro desde hace

4 años 2 meses
Nombre
Jaime
Apellidos
Olalla
Enlace permanente

María Jesús Morillo

Muchas gracias por tu interés, Marystella. Lo verdaderamente importante es la calidad de los datos. Si los datos son malos, publicarlos como datos enlazados no los hará mejores. Como catalogadores debemos preocuparnos de que nuestros datos sean óptimos. Un abrazo, María Jesús

Miembro desde hace

4 años 2 meses
Nombre
Jaime
Apellidos
Olalla
Enlace permanente

Nora

Muy buena la explicación María Jesús, no me resulto para nada aburrida, sera porque soy Bibliotecaria!!! Saludos cordiales

Miembro desde hace

4 años 2 meses
Nombre
Jaime
Apellidos
Olalla
Enlace permanente

María Jesús

Muchas gracias, Nora. Me alegro de que te haya interesado. :-) María Jesús

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.