Arxiu de la Web Espanyola

L'Arxiu del Web Espanyol és la col·lecció formada pels llocs web (inclosos blogs, fòrums, documents, imatges, vídeos, etc.) que es recullen a fi de preservar el patrimoni documental espanyol a Internet i assegurar-hi l'accés.

A causa de les enormes dimensions d'Internet i dels mitjans tecnològics dels quals disposem actualment, avui dia és impossible aspirar a l'exhaustivitat en l'arxivament web. Per això, per intentar guardar la quantitat més gran possible d'informació web, la Biblioteca Nacional d'Espanya ha optat per un model mixt que combina recol·leccions massives i selectives, com fan altres biblioteques nacionals del món.

Aquestes col·leccions es poden consultar tant a la Biblioteca Nacional d'Espanya com als Centres de Conservació de les diferents comunitats autònomes.

 

Llocs web arxivats 

Història de la col·lecció

La recol·lecció de pàgines web es fa amb robots rastrejadors que recorren els URL seleccionats prèviament i guarden tot el que hi troben enllaçat, amb la freqüència, profunditat i mida que es determini. El resultat d'aquestes recol·leccions web són els arxius web, on es guarda i es pot consultar el que s'ha recollit.

A la Biblioteca Nacional d'Espanya per arxivar el web s'utilitza NAS (NetarchiveSuite), una eina de codi obert dissenyada per la Biblioteca de Dinamarca, i que actualment també utilitzen per a aquest propòsit altres biblioteques nacionals com la de França i la d'Àustria. Per rastrejar incorpora el robot Heritrix, creat per Internet Archive, primera organització que va començar a rastrejar i arxivar el web el 1996.

Les recol·leccions pretenen reproduir amb detall l'aspecte del lloc i les seves funcionalitats disponibles durant la captura, de manera que la rèplica del lloc web sigui tan navegable com la seva versió “viva”. Una vegada s'ha completat el rastreig, els webs arxivats són visualitzats a l'OpenWayback, una aplicació que ofereix a l'usuari la possibilitat de seleccionar quina versió concreta d'un web determinat vol consultar.

Inspirant-se en les directrius per a la preservació del patrimoni digital de la UNESCO (2003) i en la Recomanació de la Comissió Europea de 24 d'agost de 2006 sobre la digitalització i l'accessibilitat en línia del material cultural i la conservació digital, la BNE va començar a capturar pàgines i llocs web espanyols allotjats en el domini .es, així com en altres dominis i subdominis genèrics (.com, .edu, .gob, .org, .net, etc.).

Des que el projecte de la BNE va arrencar el 2009 fins a finals de 2013 es van dur a terme vuit recol·leccions massives del domini .es i dues recol·leccions selectives. La primera selectiva va tenir per objectiu cobrir de manera monogràfica les eleccions generals del 20 de novembre de 2011, i la segona es va ocupar de reunir recursos espanyols de l'àmbit de les humanitats. El resultat d'aquestes recol·leccions, fetes per Internet Archive per a la BNE, va ser traslladat als servidors de la Biblioteca a finals de 2014, gràcies a un conveni de col·laboració signat amb Red.es. Red.es col·labora activament amb la Biblioteca en el desenvolupament tecnològic i d'infraestructures per a la gestió del dipòsit legal de les publicacions en línia.

El 2014 la Biblioteca va instal·lar en un entorn de proves el paquet d'eines de codi obert NetarchiveSuite per rastrejar i arxivar el web. Amb aquest sistema propi la Biblioteca ha fet des d'aleshores diverses recol·leccions selectives sobre esdeveniments rellevants per a la història i la cultura espanyoles, com la mort d'Adolfo Suárez, l'abdicació de Joan Carles I, la proclamació de Felip VI, les eleccions europees de 2014, les locals i autonòmiques de 2015 i les eleccions generals de 2015-2016.

El 2015, i després d'una llarga tramitació, es va publicar el Reial decret 635/2015, de 10 de juliol, pel qual es regula el dipòsit legal de les publicacions en línia, que va entrar en vigor el 26 d'octubre d'aquell any. Aquest Reial decret protegeix l'activitat en matèria de preservació de publicacions en línia que els centres de conservació han dut a terme durant els últims anys, en particular quant als projectes d'arxivament web.
 

El 2016 es va dur a terme la primera recol·lecció massiva del domini .es amb recursos propis, que va durar 3 mesos.

Durant aquell any, a més, es va consolidar la cooperació entre els centres de conservació de les comunitats autònomes i la BNE per gestionar i construir un dipòsit legal de les publicacions en línia col·laboratiu. Cada vegada són més els centres que gestionen les seves pròpies col·leccions web, utilitzant les eines que la BNE ha posat a la seva disposició.

 

  Subcolecciones

  Subcolecciones
  internet web linked data
  Massives

  Les recol·leccions massives rastregen un domini complet i ofereixen una foto estàtica del panorama de la web en un moment determinat.

  Temáticas Archivo web
  Temàtiques

  Para capturar una selección de recursos sobre un tema o tipo de documento.

  Comunidades Autónomas Archivo Web
  Comunitats Autònomes

  Les Comunitats Autònomes tenen designats centres de conservació que seleccionen llocs web per enriquir el patrimoni documental en línia sobre les seves regions.

  Eventos Archivo web
  Esdeveniments destacats

  Selecció de llocs web sobre esdeveniment d'especial rellevància per a la societat espanyola.

  Elecciones Archivo web
  Eleccions

  En col·laboració amb les CC. AA. se seleccionen llocs web i xarxes socials sobre els principals processos electorals espanyols des de 2015.

  Riesgo Web española
  Risc

  Recol·leccions d'emergència que es realitzen en el cas de risc de desaparició d'un lloc web.