La importancia del texto en el contexto: mesa redonda de archivos en la Jornada de Web Semántica

26 de Mayo de 2014

Julio Cerdá, director del Archivo Municipal de Arganda del Rey, o más bien post-archivero (como le denomina Joan Soler Jiménez, Presidente de la Asociación de Archiveros), profesional curioso, innovador, emprendedor e incluso “visionario”, modera la mesa redonda de Archivos. Su proactividad y sus kilómetros recorridos en la difusión de datos digitales (mapas interactivos, datos exportables…), le llevan a protagonizar, más que moderar, la mesa compuesta por Adrian Stevenson, Julián Moyano, Santiago Navarro, Francesca Ricci y Alfonso Sánchez Mairena.

Adrian Stevenson

“No hay nada fuera del texto”. Así comienza Adrian Stevenson su presentación, trayendo al auditorio el famoso eslogan del filósofo francés Jacques Derrida que caracteriza el pensamiento de la deconstrucción, y enlazándolo con el universo de los archivos: “no hay nada fuera del contexto”. El contexto es un pilar clave en la gestión de documentos y archivos. El documento no es nada sin su contexto, pues permite comprender mejor el conjunto de circunstancias que se han producido alrededor del mismo así como los diferentes aspectos que le pueden afectar (como quién firma o qué relación tiene con otros documentos). El documento existe porque es el resultado de una actividad humana, se produce en el transcurso de las actividades de una organización, y este conjunto de circunstancias es tan necesario para la comprensión de los hechos y los datos como la propia información que aporta el documento en sí. Pero el contexto tiene también un fuerte significado en el universo Linked Data: datos enlazados, datos estructurados e interconectados en la web, que potencian las conexiones, y por tanto aportan contextos de otros mundos, no sólo del mundo del Archivo.

"Il n´y a pas de hors-texte": challenges for Archival Linked Data. Adrian Stevenson from Biblioteca Nacional de España

El concepto de deconstrucción, traído al universo de la web semántica, significa descomponer los documentos en datos correctamente identificados, estructurados y descritos de forma normalizada, así como establecer relaciones entre los mismos, construyendo de este modo la web de datos enlazados. La deconstrucción sumada a la contextualización multiplica las relaciones de información existentes en los archivos y permite explotaciones semánticas que superan los límites actuales: visualización de información en mapas interactivos, líneas de tiempo para visualizar datos enlazados, álbumes de fotos presentados en 3D que ofrecen nuevas formas de exploración de colecciones, etc. Nos permite adentrarnos en la narrativa digital, en contar historias a través de la contextualización de los datos y también en la visualización de grandes volúmenes de datos, de forma que nos revela patrones y nos comunica un contexto, además de ofrecernos acceso a una granularidad de elementos individuales hasta ahora impensable. En definitiva, como dice Steven, permite situar a los archivos en el espacio global de información.

Pero tal abstracción, sin embargo, no está exenta de desafíos, tal y como plantea Stevenson: alta curva de aprendizaje, persistencia de URIs, mantenimiento actualizado de datos, sostenibilidad y trazabilidad de las fuentes de datos, cuestiones relacionadas con las licencias de datos, falta de ejemplos en archivos, así como otras complejidades relacionadas con la compatibilidad entre la descripción archivística, jerárquica y multinivel, y el modelado de datos RDF.

Julián Moyano

La siguiente intervención, protagonizada por Julián Moyano, técnico de Archivos del Archivo de la Administración de la Comunidad Autónoma de Aragón, se centra en defender que también la gestión de documentos puede y debe adoptar un modelo semántico.

Presentación en Slideshare

Los archivos administrativos deben hacer frente a diferentes plataformas informáticas y bases de datos con las que se crean, utilizan, tramitan y consultan documentos, así como a la convivencia de diferentes soportes (papel y electrónico). Su objetivo constante es realizar una gestión íntegra de los documentos. Su fortaleza reside en el conocimiento contenido en la información descriptiva e identificativa de las series documentales. Un conocimiento imprescindible para gestionar correctamente los documentos, y que supone un nexo de unión independiente de plataformas, bases de datos y soportes. A partir de estas premisas, Julián Moyano propone avanzar hacia un modelo semántico para la gestión documental, en el que, partiendo de la interoperabilidad de datos se alcance la interoperabilidad de conocimiento. Esta transformación de descripciones documentales a modelos de datos enlazados requiere de: una identificación de las posibles entidades que forman parte de los sistemas; una definición de relaciones entre dichas entidades; una normalización de estructuras y propiedades de la información y una unificación y centralización de datos, para ofrecer finalmente la información.

Los resultados serían una gestión de documentos más inteligente, con acceso a recursos documentales y a su contexto, en una explotación semántica de expedientes y documentos referenciados.

Santiago Navarro

Santiago Navarro, socio director de KeenSoft, defiende en su presentación que, a pesar de lo que pueda pensarse, existe un mercado del open source de tecnología de web semántica, lo que permite, en especial a los archivos, que la explotación semántica sea un hito alcanzable.

Presentación en Slideshare

Los archivos son generadores de datos, representando mediante la descripción archivística la información y contexto de los documentos de archivo. Pero también son consumidores de datos, y en ese sentido, la tecnología de datos enlazados puede reportar innumerables beneficios a los archivos: ayudar a la investigación, ofrecer herramientas de consulta más potentes, ofrecer información relacionada, dotar de enlaces a otros catálogos, ampliar la visibilidad del archivo y sus contenidos, e incluso ayudar a una mejor preservación de la información.

La construcción de una capa semántica para el archivo, ya informatizado, supone aplicar en las fases de descripción, gestión y publicación, una serie de componentes de descripción semántica, constructor RDF y enriquecedor, un gestor de ontologías propias y externas, así como de un almacenamiento de tripletas RDF. El componente indexador/analizador permitirá que posteriormente puedan realizarse búsquedas semánticas.

Si bien el mercado de software de código abierto de tecnología semántica permite que nos beneficiemos de un montón de fuentes abiertas, al mismo tiempo se requiere aplicar una solución a medida de cada proyecto o caso.

Francesca Ricci

Francesca Ricci, archivera en el Istituto per i beni artistici culturali e naturali della Regione Emilia-Romagna, presenta el proyecto Reload –Repository for Linked Open Archival Data- que comenzó en 2011 con la creación de una ontología del estándar EAC-CPF (Encoded Archival Context –Corporate Bodies, Person and Families), y de otra ontología para representar los registros EAC-CPF que contienen las descripciones de los creadores de documentos de archivo. Por tanto, la apertura de los registros de autoridad, que por su propia naturaleza son puntos de acceso entre diferentes recursos, significa no sólo establecer conexiones con archivos, sino también con bibliotecas, libros, y otras personas o entidades relacionadas.

Presentación en Slideshare

La intervención final de la mesa redonda de archivos corrió a cargo de Alfonso Sánchez Mairena, quien abrió el camino de PARES, el Portal de Archivos Españoles, hacia la web semántica. El punto de partida de este camino es el trabajo realizado sobre normas de contenido, como el Modelo Conceptual de la CNEDA o las Normas de Punto de Acceso (NPA).

Por su parte, Julio Cerdá, hizo un llamamiento, desde su experiencia, a que se pusieran a disposición de todos, tutoriales sobre cómo montar un repositorio institucional OAI, base de la interoperabilidad semántica.

Escrito por: