Saltar al menú principal
Saltar al contenido

Archivo de la web española

¿Qué es un archivo web?

Denominamos “archivo web” a la colección formada por la recolección automatizada de sitios web. Un archivo web está compuesto por páginas y sitios web cuyos contenidos han sido concebidos para su publicación en redes de comunicación. La finalidad de un archivo web es la preservación y difusión de estos recursos “nacidos digitales” para que puedan servir como herramienta de conocimiento para generaciones presentes y futuras.

El Archivo de la Web Española

La Biblioteca Nacional de España (BNE) creó en 2009 el Archivo de la Web Española con objeto de conservar y facilitar el acceso futuro a todos los contenidos españoles publicados en Internet (webs, blogs, foros, listas de distribución, documentos, imágenes, vídeos, etc.). En España PADICAT (Patrimonio Digital de Cataluña) y ONDARENET (Archivo del Patrimonio Digital Vasco) se ocupan del archivo del patrimonio digital catalán y vasco desde 2005 y 2007 respectivamente.

Inspirándose en las Directrices para la preservación del patrimonio digital de la UNESCO (2003) y en la Recomendación de la Comisión Europea de 24 de agosto de 2006 sobre la digitalización y la accesibilidad en línea del material cultural y la conservación digital, la BNE captura páginas y sitios web españoles albergados en el dominio .es, así como en otros dominios y subdominios genéricos (.com, .edu, .gob, .org, .net, etc.).

En el marco de este proyecto, la BNE es miembro del Consorcio Internacional para la Preservación de Internet (International Internet Preservation Consortium –IIPC-) desde 2010, organización que aglutina las iniciativas más importantes a nivel mundial en el campo del archivado web y en la que se integran bibliotecas nacionales de todo el mundo así como instituciones patrimoniales como archivos y bibliotecas universitarias y de investigación; y forma parte de su Consejo Directivo desde 2014.

Desde que el proyecto de la BNE arrancó en 2009 hasta finales de 2013 se han llevado a cabo ocho recolecciones masivas del dominio .es y dos recolecciones selectivas. La primera selectiva tuvo como objetivo cubrir de forma monográfica las Elecciones Generales del 20 de noviembre de 2011 y la segunda se ocupó de reunir recursos españoles del ámbito de las Humanidades. El resultado de estas recolecciones, hechas por Internet Archive para la BNE, fue trasladado a los servidores de la Biblioteca a finales de 2014, gracias a un convenio de colaboración firmado con Red.es. Red.es colabora activamente con la Biblioteca en el desarrollo tecnológico y de infraestructuras para la gestión del depósito legal de las publicaciones en línea.

En 2014 la Biblioteca instaló en un entorno de pruebas el paquete de herramientas de código abierto NetarchiveSuite para rastrear y archivar la web. Este software de código abierto es el que emplean para rastrear sus webs respectivas otras bibliotecas nacionales como la de Dinamarca, Francia, Austria y Estonia. Con este sistema propio la Biblioteca ha realizado desde entonces varias recolecciones selectivas sobre acontecimientos relevantes para la historia y la cultura españolas, como la muerte de Adolfo Suárez, la abdicación de Juan Carlos I, la proclamación de Felipe VI, la consulta del 9N en Cataluña, las elecciones europeas de 2014, y las locales y autonómicas de 2015.

Con la aprobación del Real Decreto que regula el Depósito Legal de las publicaciones en línea, la BNE y los centros de conservación de las CC.AA. tienen el respaldo legal que los habilita para recolectar los sitios web, como parte de la misión de preservación del patrimonio documental que les es propia.