Archivo web

De la nube al olvido: el archivo de las revistas electrónicas

¿Alguna vez has publicado un artículo en una revista electrónica que ha desaparecido de Internet? ¿Te has preguntado dónde podrías encontrar aquel blog que tanto te gustaba y ya no aparece por ningún sitio?

 

Desde 2020, la BNE lanza cada año sus redes, como si de pesca de arrastre se tratase, para capturar todas las revistas electrónicas registradas con ISSN en España.

El Archivo de la Web Española como entrenador de los modelos del Procesamiento del Lenguaje Natural

 

 

La mayoría de los archivos web llevan algo más de 20 años formando sus colecciones de sitios web, con la esperanza de que vayan adquiriendo valor, según la información vaya desapareciendo en Internet. Pero, ¿tenemos que esperar tanto tiempo para que nuestras colecciones sean útiles?

 

 

¿Qué es una recolección web masiva? ¿Para qué sirve?

Pocos se imaginan la dársena de la Biblioteca Nacional de España llena de cajas con todo lo que ingresa por depósito legal. Impresiona. En la BNE ingresan dos ejemplares de todo lo que se publica en España en soporte físico. ¡De todo! Podríamos decir que el depósito legal implica recolectar de forma masiva la producción editorial española.

pila-papeles

¿Edad oscura digital? Sí, pero...

Que estamos atravesando lo que con el paso de los años se verá como una edad oscura digital, creo que es algo que nadie puede negar, pero que las voces que alertan sobre ello están siendo especialmente alarmistas en los últimos tiempos también es cierto.

El vicepresidente de Google Vint Cerf causó bastante revuelo en la red (principalmente en el entorno bibliotecario) el 13 de febrero pasado con unas declaraciones en las que advertía del peligro de estar entrando en una edad oscura digital.

El depósito legal de las publicaciones electrónicas

Por fin podemos leer todos el borrador del real decreto que ha de regular el depósito legal de las publicaciones electrónicas, y que se lleva gestando desde que entró en vigor la nueva ley de depósito legal (23/2011), como desarrollo de esta en lo que afecta a las publicaciones en línea.

Internet Archive y el archivo de la web española

Internet Archive es una institución sin ánimo de lucro, pionera en el campo de los archivos web. Archiva la web desde 1996 y desde 2001 da acceso abierto y gratuito a sus más de 150 billones de páginas web a través de la Wayback Machine. Esto le convierte en el mayor y más antiguo archivo web público.