Saltar al menú principal
Saltar al contenido

Archivo de la web española

Que é un arquivo web?

Denominamos "arquivo web" á colección formada pola recolección automatizada de fragmentos da web. Un arquivo web está composto por páxinas e sitios web cuxos contidos foron concibidos para a súa publicación en redes de comunicación. A finalidade dun arquivo web é a preservación e difusión destes recursos "nacidos dixitais" para que poidan servir como ferramenta de coñecemento para xeracións presentes e futuras.

O arquivo web da BNE

A BNE creou en 2009 o Arquivo da web española co obxecto de conservar e facilitar o acceso futuro a todos os contidos españois publicados en Internet (webs, blogs, foros, listas de distribución, documentos, imaxes, vídeos, etc.), seguindo o ronsel de dous proxectos predecesores que se ocupan do arquivo do patrimonio dixital catalán e vasco dende 2005 e 2007, respectivamente: PADICAT (Patrimonio Dixital de Cataluña, creado en 2005) e ONDARENET (Arquivo do Patrimonio Dixital Vasco, en 2007).

Inspirándose nas Directrices para a preservación do patrimonio dixital da UNESCO (2003) e na Recomendación da Comisión Europea do 24 de agosto de 2006 sobre a dixitalización e a accesibilidade en liña do material cultural e a conservación dixital, a BNE captura páxinas e sitios web españois albergados no dominio .es, así como noutros dominios e subdominios xenéricos (.com; .edu; .gob; .org; .net; .biz, etc.).

No marco deste proxecto, a BNE é membro do Consorcio Internacional para a Preservación de Internet (International Internet Preservation Consortium -IIPC-) dende 2010, organización que aglutina as iniciativas máis importantes a nivel mundial no campo do arquivado web e na que se integran bibliotecas nacionais de todo o mundo así como institucións patrimoniais como arquivos e bibliotecas universitarias e de investigación.

O Arquivo da web española reúne máis de 85 TB de información comprimida en formato WARC (Web ARChive file format, estándar internacional ISO 28500), un formato de arquivo utilizado globalmente para estruturar, xestionar e almacenar obxectos dixitais. Para recompilar esta magnitude de datos a BNE contou coa colaboración da Fundación Internet Archive, que arquiva contidos publicados en Internet dende 1996.

Dende que o proxecto da BNE arrancou en 2009 ata mediados de 2012 leváronse a cabo seis recoleccións masivas do dominio .es e dúas recoleccións selectivas. A primeira selectiva tivo como obxectivo cubrir de forma monográfica as Eleccións Xerais do 20 de novembro de 2011 e a segunda ocupouse de reunir recursos españois do ámbito das Humanidades. Para o segundo trimestre de 2013 está previsto levar a cabo unha sétima recolección masiva do dominio .es.

Á espera da promulgación do Real decreto que regule o depósito legal electrónico -que se encontra en fase de tramitación-, a Biblioteca Nacional de España asinou un convenio con Red.es para a construción dun repositorio dixital que permita preservar o patrimonio documental en liña.