La Biblioteca de Catalunya y la Biblioteca Nacional de España colaboran para la preservación del dominio .cat
Gracias a la colaboración entre ambas instituciones, se ha guardado por primera vez en el Archivo de la Web Española para su preservación el dominio .cat, referente de la cultura y la lengua catalana en Internet.
La Biblioteca de Catalunya, pionera en el archivado web en España, mantiene un proyecto creado en 2005, conocido como PADICAT, para la captura, preservación y difusión del archivo web de Cataluña.
La Biblioteca Nacional de España, dentro de sus objetivos de preservar el patrimonio documental independientemente del tipo de soporte, creó en 2009 el Archivo de la Web Española para guardar la información y documentación que se distribuye en internet.
El listado completo de dominios registrados en el .cat es de más de 68.000, pero aproximadamente un 35% de estos no tienen contenido. De los 44.000 dominios con contenido que han sido recolectados, el 77 % se han guardado íntegramente, mientras que un 23 % han superado los 150 MB de información, límite establecido habitualmente para este tipo de recolecciones de amplio espectro. El contenido guardado supone un total de 2,5 TB de información.
Para guardar los contenidos de la web la BNE trabaja con un software de recolección automático, NetarchiveSuite (creado por la Biblioteca Real de Dinamarca), que utiliza 71 arañas que rastrean la Web y guardan los contenidos pinchando y descargando la información de los enlaces que encuentra.
La recolección del dominio .cat está en la línea de las recolecciones masivas que la BNE lleva a cabo anualmente de los dominios .es y .gal.
La captura y preservación a largo plazo del patrimonio documental en línea es ya hoy una tarea imprescindible para las instituciones de la memoria y, dada su complejidad y alcance, requiere de la colaboración institucional y, en general, de todos los sectores implicados.