Archivo de la web española

Proyectos
Nacional
Archivo de la web española
Imagen
recurso internet web

El objetivo del Archivo de la Web Española es conservar y facilitar el acceso futuro a todos los contenidos españoles publicados en Internet (webs, blogs, foros, listas de distribución, documentos, imágenes, vídeos, etc.). Para ello, la Biblioteca captura páginas y sitios web españoles albergados en el dominio .es, así como en otros dominios y subdominios genéricos (.com; .edu; .gob; .org; .net; .biz, etc.).

Proceso de recolección

Las recolecciones de la web (web crawls en inglés) se llevan a cabo con robots de rastreo (web crawlers), que recorren la web a partir de una serie de URL iniciales llamadas seeds o semillas. Los crawlers toman estas URL como punto de partida para comenzar la recolección, y van guardando de forma automática cada página o sitio identificado, recorriendo todos los hiperenlaces que encuentran y añadiéndolos a la lista de URL que visitarán recursivamente, almacenando de forma ordenada los documentos, vídeos, imágenes, etc. que se ocultan tras cada vínculo. Estos contenidos son indexados posteriormente con el fin de poder realizar búsquedas sobre ellos.

Colaboración nacional

  • El Consejo de Cooperación Bibliotecaria (CCB). Canaliza la cooperación entre los diferentes centros de conservación y la Biblioteca Nacional de España. El proyecto incluye a día de hoy más de 40 conservadores web que apoyan en la selección de semillas y control de calidad de lo guardado. Este apoyo se centra principalmente en las colecciones autonómicas y en los eventos relacionadas con ellas.
  • Red de Bibliotecas Universitarias (Rebiun). En el año 2023 se renueva el convenio con la Red de Bibliotecas Universitaria para el apoyo de personal por parte del CSIC y diversas universidades. Actualmente colaboran en torno a 10 conservadores web que apoyan en la selección de semillas para temáticas relacionadas con la ciencias e Internet.
  • Fundación Sancho el Sabio. Institución cultural centrada en recopilar, ordenar, conservar y difundir documentación referida a la cultura vasca. Desde 2019 apoya con varios conservadores web para la selección de sitios web en Internet relacionados con el País Vasco.

Colaboración internacional

Las recolecciones de evento pueden ser también colaborativas. La Biblioteca Nacional de España participa en recolecciones colaborativas organizadas por el IIPC (International Internet Preservation Consortium) o alguno de sus miembros, con motivo de acontecimientos de interés internacional. Estos son algunos ejemplos:

Charlie Hebdo

European Refugee Crisis 

Artificial Intelligence 

Novel Coronavirus (COVID-19) 

2020 Summer Olympics and Paralympics [held in 2021] 

Afghanistan Regime Change (2021) and the International Response

War in Ukraine 

 

Contenidos relacionados
Colecciones
Archivo de la Web Española

Formada por los sitios web que se recolectan con el fin de preservar el patrimonio documental español en Internet