Saltar al menú principal
Saltar al contenido

Història de la col·lecció

Arxiu de la Web Espanyola

La recol·lecció de pàgines web es fa amb robots rastrejadors que recorren els URL seleccionats prèviament i guarden tot el que hi troben enllaçat, amb la freqüència, profunditat i mida que es determini. El resultat d'aquestes recol·leccions web són els arxius web, on es guarda i es pot consultar el que s'ha recollit.

A la Biblioteca Nacional d'Espanya per arxivar el web s'utilitza NAS (NetarchiveSuite), una eina de codi obert dissenyada per la Biblioteca de Dinamarca, i que actualment també utilitzen per a aquest propòsit altres biblioteques nacionals com la de França i la d'Àustria. Per rastrejar incorpora el robot Heritrix, creat per Internet Archive, primera organització que va començar a rastrejar i arxivar el web el 1996.

Les recol·leccions pretenen reproduir amb detall l'aspecte del lloc i les seves funcionalitats disponibles durant la captura, de manera que la rèplica del lloc web sigui tan navegable com la seva versió “viva”. Una vegada s'ha completat el rastreig, els webs arxivats són visualitzats a l'OpenWayback, una aplicació que ofereix a l'usuari la possibilitat de seleccionar quina versió concreta d'un web determinat vol consultar.

Inspirant-se en les directrius per a la preservació del patrimoni digital de la UNESCO (2003) i en la Recomanació de la Comissió Europea de 24 d'agost de 2006 sobre la digitalització i l'accessibilitat en línia del material cultural i la conservació digital, la BNE va començar a capturar pàgines i llocs web espanyols allotjats en el domini .es, així com en altres dominis i subdominis genèrics (.com, .edu, .gob, .org, .net, etc.).

Des que el projecte de la BNE va arrencar el 2009 fins a finals de 2013 es van dur a terme vuit recol·leccions massives del domini .es i dues recol·leccions selectives. La primera selectiva va tenir per objectiu cobrir de manera monogràfica les eleccions generals del 20 de novembre de 2011, i la segona es va ocupar de reunir recursos espanyols de l'àmbit de les humanitats. El resultat d'aquestes recol·leccions, fetes per Internet Archive per a la BNE, va ser traslladat als servidors de la Biblioteca a finals de 2014, gràcies a un conveni de col·laboració signat amb Red.es. Red.es col·labora activament amb la Biblioteca en el desenvolupament tecnològic i d'infraestructures per a la gestió del dipòsit legal de les publicacions en línia.

El 2014 la Biblioteca va instal·lar en un entorn de proves el paquet d'eines de codi obert NetarchiveSuite per rastrejar i arxivar el web. Amb aquest sistema propi la Biblioteca ha fet des d'aleshores diverses recol·leccions selectives sobre esdeveniments rellevants per a la història i la cultura espanyoles, com la mort d'Adolfo Suárez, l'abdicació de Joan Carles I, la proclamació de Felip VI, les eleccions europees de 2014, les locals i autonòmiques de 2015 i les eleccions generals de 2015-2016.

El 2015, i després d'una llarga tramitació, es va publicar el Reial decret 635/2015, de 10 de juliol, pel qual es regula el dipòsit legal de les publicacions en línia, que va entrar en vigor el 26 d'octubre d'aquell any. Aquest Reial decret protegeix l'activitat en matèria de preservació de publicacions en línia que els centres de conservació han dut a terme durant els últims anys, en particular quant als projectes d'arxivament web.

El 2016 es va dur a terme la primera recol·lecció massiva del domini .es amb recursos propis, que va durar 3 mesos.

Durant aquell any, a més, es va consolidar la cooperació entre els centres de conservació de les comunitats autònomes i la BNE per gestionar i construir un dipòsit legal de les publicacions en línia col·laboratiu. Cada vegada són més els centres que gestionen les seves pròpies col·leccions web, utilitzant les eines que la BNE ha posat a la seva disposició.