Archive de la web espagnole

Les archives de l'Internet espagnol sont composées des sites (y compris les blogs, les forums, les documents, les images, les vidéos, etc.) collectés afin de préserver le patrimoine documentaire espagnol en ligne et d'en garantir l'accès.

Compte tenu de la taille de l'Internet et des moyens technologiques dont nous disposons actuellement, il est impossible de prétendre à un archivage exhaustif. Par conséquent, afin de conserver la plus grande quantité possible d'informations, la Bibliothèque nationale d'Espagne a choisi un modèle mixte associant collectes larges et ciblées, à l'instar d'autres bibliothèques nationales.

 

 Sites archivés 

Histoire de la collection

La collecte des sites est effectuée à l'aide de robots d'indexation qui parcourent les URL préalablement sélectionnées et capturent tout ce qui leur est associé selon une fréquence, une profondeur et un format déterminés. Les sites et les pages ainsi collectés sont ensuite archivés et peuvent être consultés.

La Bibliothèque nationale d'Espagne utilise NAS (NetarchiveSuite), un outil à code ouvert conçu par la Bibliothèque du Danemark et également utilisé par d'autres bibliothèques nationales, telles que celles de France et d'Autriche. Cet outil incorpore le robot Heritrix, créé par Internet Archive, première organisation consacrée à l'archivage de l'Internet depuis 1996.

Les collectes ont pour objectif de reproduire en détail l'aspect du site et ses fonctionnalités au moment de la capture, de sorte qu'il soit possible de naviguer aussi bien sur la réplique que sur le site original. Après leur capture, les sites archivés sont visionnés par le biais de l'Open Wayback, une application qui offre à son utilisateur la possibilité de sélectionner la version qu'il souhaite consulter.

S'inspirant des directives pour la préservation du patrimoine numérique de l'UNESCO (2003) et de la recommandation de la Commission européenne du 24 août 2006 relative à la numérisation et à l'accessibilité en ligne du matériel culturel et à la conservation numérique, la BNE a entrepris de capturer des pages et des sites espagnols hébergés sur le domaine .es, ainsi que sur d'autres domaines et sous-domaines génériques (.com, .edu, .gob, .org, .net, etc.).

Depuis la mise en œuvre du projet de la BNE (de 2009 à 2013), huit collectes larges du domaine .es et deux collectes ciblées ont été réalisées. La première collecte sélective visait à couvrir, de manière exhaustive, les élections législatives du 20 novembre 2011, tandis que la deuxième collecte a permis de regrouper des ressources espagnoles dans le domaine des sciences humaines. Le résultat de ces collectes, effectuées par Internet Archive pour la BNE, a été transféré sur les serveurs de la Bibliothèque nationale fin 2014 grâce à un accord de partenariat avec Red.es. Red.es collabore activement avec la Bibliothèque dans le cadre du développement technologique et des infrastructures pour la gestion du dépôt légal des publications en ligne.

En 2014, la Bibliothèque a installé, en vue de le tester, l'outil à code ouvert NetarchiveSuite pour capturer et archiver les sites de l'Internet. Grâce à ce système, la Bibliothèque a dès lors effectué plusieurs collectes ciblées d'événements importants pour l'histoire et la culture espagnoles, comme la mort d'Adolfo Suárez, l'abdication de Juan Carlos I, la proclamation de Felipe VI, les élections européennes de 2014, les élections locales et autonomiques de 2015 et les élections générales de 2015-2016.

En 2015, suite à une longue procédure, le décret royal 635/2015 du 10 juillet portant sur la régulation du dépôt légal des publications en ligne a été publié. Il est entré en vigueur le 26 octobre de cette même année. Ce décret contribue à soutenir l'activité en matière de préservation des publications en ligne que les centres de conservation ont réalisé au cours de ces dernières années, en particulier dans le cadre des projets d'archivage de l'Internet.

En 2016, la première collecte large du domaine .es a été effectuée à l'aide de nos propres ressources. Cette collecte s'est déroulée sur 3 mois.

Au cours de cette même année, la coopération entre les centres de conservation des communautés autonomes et la BNE a été renforcée en vue de gérer et de construire ensemble un dépôt légal des publications en ligne. Grâce aux outils que la BNE a mis à leur disposition, les centres mettant en œuvre leurs propres collectes sont de plus en plus nombreux.

Subcolecciones

Subcolecciones
internet web linked data
Collectes larges

Les collectes larges permettent de constituer des échantillons représentatifs de l'Internet au moment auquel a lieu la collecte.

Temáticas Archivo web
Thématiques

Pour capturer une sélection de ressources sur un thème ou type de document.

Comunidades Autónomas Archivo Web
Communautés autonomes

Les Communautés Autonomes ont des désignés centres de conservation pour la gestion du dépôt légal de publications en ligne et ils élaborent des collections thématiques avec les ressources qu'envisagent nécessaire conserver comme part du dépôt légal de son milieu competencial.

Eventos Archivo web
Evénements soulignés

Événements particulièrement importants pour la société espagnole

Elecciones Archivo web
Élections

Spéciale importance par sa valeur sociale et politique pour la société espagnole d'aujourd'hui et du futur.

Riesgo Web española
Risque

Il s'agit de recolecciones d'émergence se réalisent dans le cas de risque de disparition de sites web.