El número de dominios .es guardados por la Biblioteca Nacional de España en 2024 crece un 5% y alcanza los 2,1 millones
La Biblioteca Nacional de España (BNE) ha concluido la novena recolección masiva del dominio .es. Se han guardado más de dos millones de dominios web, superando los 200 TB de información.
Las recolecciones masivas anuales se realizan de forma automática mediante rastreadores que escanean todos los sitios web a partir de un listado de dominios proporcionado por Red.es, empresa pública encargada de mantener el dominio. De esta forma se obtiene una visión global del patrimonio documental en Internet, que se conserva en la BNE desde el año 2009 a través del Archivo de la Web Española. En 2024 este proyecto ha cumplido 15 años como garante de la preservación del patrimonio digital en español, guardando sitios web que permitan entender nuestra sociedad y el estudio de los acontecimientos que en ella tuvieron lugar a los investigadores del futuro.
En 2024 el número de dominios ha crecido un 5 % en comparación al año anterior, superando los 2.100.000 de dominios recolectados, lo que implica un número muy superior de sitios web. A este crecimiento anual se suma el reto técnico de seguir mejorando la calidad de las capturas. Con este propósito se han revisado los parámetros del robot, ajustando la profundidad de captura y reduciendo los enlaces externos a otros dominios, descargando así más información relevante de cada dominio. Esto ha permitido reducir el tiempo de ejecución de los trabajos, alcanzando los 71 días de forma ininterrumpida.
Toda la información conservada en el Archivo de la Web Española, a pesar de encontrarse libre en Internet, tiene derechos de autor vigentes, por lo que solo es consultable a través de terminales informáticos situados en las diferentes salas de la Biblioteca Nacional de España, así como los centros de conservación de las Comunidades Autónomas. No obstante, desde Internet, accediendo a la página de búsqueda, se pueden comprobar los sitios web que han sido guardados y con qué frecuencia.
La cobertura de elecciones, un ejemplo de colaboración entre los centros de conservación y la BNE
El Archivo de la Web Española y los centros de conservación de las Comunidades Autónomas han colaborado en la cobertura de las elecciones autonómicas celebradas este año en el País Vasco, Galicia y Cataluña. Los conservadores web de dichas Comunidades han trabajado en la selección de sitios web relativos a encuestas, sondeos, estudios electorales e información electoral. Asimismo, con motivo de las elecciones al Parlamento Europeo el 9 de junio de 2024 se han guardado más de 300 sitios web. Todas estas nuevas colecciones se pueden consultar a través de la Búsqueda del Archivo de la Web Española | Biblioteca Nacional de España.