Saltar al menú principal
Saltar al contenido

Historia da colección

Arquivo da Web Española

A recolección de páxinas web realízase con robots rastrexadores que percorren as URL seleccionadas previamente e gardan todo o que encontran enlazado, coa frecuencia, profundidade e tamaño que se determine. O resultado destas recoleccións web son os arquivos web, onde se garda e se pode consultar o recollido.

Na Biblioteca Nacional de España para arquivar a web utilízase NAS (NetarchiveSuite), unha ferramenta de código aberto deseñada pola Biblioteca de Dinamarca, e que actualmente tamén utilizan para este propósito outras bibliotecas nacionais como a de Francia e a de Austria. Para rastrexar incorpora o robot Heritrix, creado por Internet Archive, primeira organización que empezou a rastrexar e arquivar a web en 1996.

As recoleccións buscan reproducir con detalle o aspecto do sitio e as funcionalidades deste dispoñibles durante a captura, de tal forma que a réplica do sitio web sexa tan navegable como a súa versión “viva”. Unha vez completado o rastrexo, as páxinas arquivadas son visualizadas na OpenWayback, unha aplicación que ofrece ao usuario a posibilidade de seleccionar que versión concreta dunha páxina web determinada desexa consultar.
Inspirándose nas Directrices para a preservación do patrimonio dixital da UNESCO (2003) e na Recomendación da Comisión Europea do 24 de agosto de 2006 sobre a dixitalización e a accesibilidade en liña do material cultural e a conservación dixital, a BNE comezou a capturar páxinas e sitios web españois albergados no dominio .es, así como noutros dominios e subdominios xenéricos (.com, .edu, .gob, .org, .net, etc.).

Dende que o proxecto da BNE arrancou en 2009 ata mediados de 2013 leváronse a cabo seis recoleccións masivas do dominio .es e dúas recoleccións selectivas. A primeira selectiva tivo como obxectivo cubrir de forma monográfica as Eleccións Xerais do 20 de novembro de 2011 e a segunda ocupouse de reunir recursos españois do ámbito das Humanidades. O resultado destas recoleccións, feitas por Internet Archive para a BNE, foi trasladado aos servidores da Biblioteca a finais de 2014, grazas a un convenio de colaboración asinado con Red.es. Red.es colabora activamente coa Biblioteca no desenvolvemento tecnolóxico e de infraestruturas para a xestión do depósito legal das publicacións en liña.

En 2014 a Biblioteca instalou nun ámbito de probas o paquete de ferramentas de código aberto NetarchiveSuite para rastrexar e arquivar a web. Con este sistema propio a Biblioteca realizou dende entón varias recoleccións selectivas sobre acontecementos relevantes para a Historia e a cultura españolas, como a morte de Adolfo Suárez, a abdicación de Juan Carlos I, a proclamación de Felipe VI, as eleccións europeas de 2014, as locais e autonómicas de 2015 e as Eleccións Xerais de 2015-2016.

En 2015, e despois dunha longa tramitación, publicouse o Real decreto 635/2015, do 10 de xullo, polo que se regulamenta o depósito legal das publicacións en liña, que entrou en vigor o 26 de outubro dese ano. Este Real decreto protexe a actividade en materia de preservación de publicacións en liña que os centros de conservación levaron a cabo nos últimos anos, en particular en canto aos proxectos do arquivado web.

En 2016 levouse a cabo a primeira recolección masiva do dominio.é con recursos propios, que durou 3 meses.

Durante ese ano, ademais, consolidouse a cooperación entre os centros de conservación das Comunidades Autónomas e a BNE para xestionar e construír un depósito legal das publicacións en liña colaborador. Cada vez son máis os centros que xestionan as súas propias coleccións web, utilizando as ferramentas que a BNE puxo a disposición de todos eles.