Archive de la Web Espagnole

Les archives de l'Internet espagnol sont composées des sites (y compris les blogs, les forums, les documents, les images, les vidéos, etc.) collectés afin de préserver le patrimoine documentaire espagnol en ligne et d'en garantir l'accès.

Compte tenu de la taille de l'Internet et des moyens technologiques dont nous disposons actuellement, il est impossible de prétendre à un archivage exhaustif. Par conséquent, afin de conserver la plus grande quantité possible d'informations, la Bibliothèque nationale d'Espagne a choisi un modèle mixte associant collectes larges et ciblées, à l'instar d'autres bibliothèques nationales.

 

 Sites archivés 

Histoire de la collection

La collecte des sites est effectuée à l'aide de robots d'indexation qui parcourent les URL préalablement sélectionnées et capturent tout ce qui leur est associé selon une fréquence, une profondeur et un format déterminés. Les sites et les pages ainsi collectés sont ensuite archivés et peuvent être consultés.

La Bibliothèque nationale d'Espagne utilise NAS (NetarchiveSuite), un outil à code ouvert conçu par la Bibliothèque du Danemark et également utilisé par d'autres bibliothèques nationales, telles que celles de France et d'Autriche. Cet outil incorpore le robot Heritrix, créé par Internet Archive, première organisation consacrée à l'archivage de l'Internet depuis 1996.

Les collectes ont pour objectif de reproduire en détail l'aspect du site et ses fonctionnalités au moment de la capture, de sorte qu'il soit possible de naviguer aussi bien sur la réplique que sur le site original. Après leur capture, les sites archivés sont visionnés par le biais de l'Open Wayback, une application qui offre à son utilisateur la possibilité de sélectionner la version qu'il souhaite consulter.

S'inspirant des directives pour la préservation du patrimoine numérique de l'UNESCO (2003) et de la recommandation de la Commission européenne du 24 août 2006 relative à la numérisation et à l'accessibilité en ligne du matériel culturel et à la conservation numérique, la BNE a entrepris de capturer des pages et des sites espagnols hébergés sur le domaine .es, ainsi que sur d'autres domaines et sous-domaines génériques (.com, .edu, .gob, .org, .net, etc.).

Depuis la mise en œuvre du projet de la BNE (de 2009 à 2013), huit collectes larges du domaine .es et deux collectes ciblées ont été réalisées. La première collecte sélective visait à couvrir, de manière exhaustive, les élections législatives du 20 novembre 2011, tandis que la deuxième collecte a permis de regrouper des ressources espagnoles dans le domaine des sciences humaines. Le résultat de ces collectes, effectuées par Internet Archive pour la BNE, a été transféré sur les serveurs de la Bibliothèque nationale fin 2014 grâce à un accord de partenariat avec Red.es. Red.es collabore activement avec la Bibliothèque dans le cadre du développement technologique et des infrastructures pour la gestion du dépôt légal des publications en ligne.

En 2014, la Bibliothèque a installé, en vue de le tester, l'outil à code ouvert NetarchiveSuite pour capturer et archiver les sites de l'Internet. Grâce à ce système, la Bibliothèque a dès lors effectué plusieurs collectes ciblées d'événements importants pour l'histoire et la culture espagnoles, comme la mort d'Adolfo Suárez, l'abdication de Juan Carlos I, la proclamation de Felipe VI, les élections européennes de 2014, les élections locales et autonomiques de 2015 et les élections générales de 2015-2016.

En 2015, suite à une longue procédure, le décret royal 635/2015 du 10 juillet portant sur la régulation du dépôt légal des publications en ligne a été publié. Il est entré en vigueur le 26 octobre de cette même année. Ce décret contribue à soutenir l'activité en matière de préservation des publications en ligne que les centres de conservation ont réalisé au cours de ces dernières années, en particulier dans le cadre des projets d'archivage de l'Internet.

En 2016, la première collecte large du domaine .es a été effectuée à l'aide de nos propres ressources. Cette collecte s'est déroulée sur 3 mois.

Au cours de cette même année, la coopération entre les centres de conservation des communautés autonomes et la BNE a été renforcée en vue de gérer et de construire ensemble un dépôt légal des publications en ligne. Grâce aux outils que la BNE a mis à leur disposition, les centres mettant en œuvre leurs propres collectes sont de plus en plus nombreux.

    Subcolecciones

    Subcolecciones
    internet web linked data
    Larges

    Les recolecciones massives pistent une domination complète et ils offrent une photo estática du panorama du web dans un moment déterminé.

    Temáticas Archivo web
    Thématiques

    Para capturar una selección de recursos sobre un tema o tipo de documento.

    Comunidades Autónomas Archivo Web
    Communautés Autonomes

    Les Communautés Autonomes ont des désignés centres de conservation qu'ils sélectionnent des sites web pour enrichir le patrimoine documentaire en ligne sur ses régions.

    Eventos Archivo web
    Evénements phares

    Sélection de sites web sur événement de spéciale importance pour la société espagnole.

    Elecciones Archivo web
    Élections

    En collaboration avec les CC. AA. Ils se sélectionnent des sites web et réseaux sociaux sur les principaux procès électoraux espagnols depuis 2015.

    Riesgo Web española
    Risque

    Recolecciones D'émergence que se réalisent dans le cas de risque de disparition d'un site web.