La Biblioteca de Catalunya y la Biblioteca Nacional de España colaboran para la preservación del dominio .cat

Comunicación
Cooperación
Preservación
La Biblioteca de Catalunya y la Biblioteca Nacional de España colaboran para la preservación del dominio .cat
10 de Agosto de 2022
Imagen
Recolección masiva del dominio .cat
El contenido guardado supone un total de 2,5 TB de información

Gracias a la colaboración entre ambas instituciones, se ha guardado por primera vez en el Archivo de la Web Española para su preservación el dominio .cat, referente de la cultura y la lengua catalana en Internet.

La Biblioteca de Catalunya, pionera en el archivado web en España, mantiene un proyecto creado en 2005, conocido como PADICAT, para la captura, preservación y difusión del archivo web de Cataluña.

La Biblioteca Nacional de España, dentro de sus objetivos de preservar el patrimonio documental independientemente del tipo de soporte, creó en 2009 el Archivo de la Web Española para guardar la información y documentación que se distribuye en internet.

El listado completo de dominios registrados en el .cat es de más de 68.000, pero aproximadamente un 35% de estos no tienen contenido. De los 44.000 dominios con contenido que han sido recolectados, el 77 % se han guardado íntegramente, mientras que un 23 % han superado los 150 MB de información, límite establecido habitualmente para este tipo de recolecciones de amplio espectro. El contenido guardado supone un total de 2,5 TB de información.

Para guardar los contenidos de la web la BNE trabaja con un software de recolección automático, NetarchiveSuite (creado por la Biblioteca Real de Dinamarca), que utiliza 71 arañas que rastrean la Web y guardan los contenidos pinchando y descargando la información de los enlaces que encuentra.

La recolección del dominio .cat está en la línea de las recolecciones masivas que la BNE lleva a cabo anualmente de los dominios .es y .gal.

La captura y preservación a largo plazo del patrimonio documental en línea es ya hoy una tarea imprescindible para las instituciones de la memoria y, dada su complejidad y alcance, requiere de la colaboración institucional y, en general, de todos los sectores implicados.

Contenidos relacionados
Colecciones
Archivo de la Web Española

Formada por los sitios web que se recolectan con el fin de preservar el patrimonio documental español en Internet