Larges
Les recolecciones massives ont par objet pister une domination complète, sans des exclusions ni sélection. Le robot recolector, à celui que se lui fournit la liste de dominations enregistrées, il les piste tous et il archive le contenu qu'il trouve à son pas, d'accord avec une configuration predeterminada.
En les recolecciones massives n'y a pas une sélection par part de bibliotecarios, ce que élimine n'importe quel filtre, biais ou subjectivité.
Les Archives du Web Espagnol il garde actuellement les quatre dominations nationales: .Il est, .gal, .cat, .eus. Il le fait une fois à l'an avec la collaboration des différents centres de conservation d'une communauté autonome. Il se réalise, en plus, un gardé massif à l'an de publications sériées en libre accès en Internet.
La consultation des contenus gardés en les recolecciones massives est seulement possible à travers URL.
La recolección de la domination .Il est il se réalise annuellement depuis 2009 et il prétend obtenir un panorama globale du web du pays chaque an.
Entre 2009 et 2013 ils s'ont menés à terme 8 recolecciones massives de la domination .Il est à travers l'infrastructure d'Internet Archive. Celles-ci recolecciones supposent la représentation la plus ancienne des sites web conservés dans les Archives du Web Espagnol.
En 2014, la Bibliothèque Nationale de l'Espagne il acquiert sa propre infrastructure de recolección et après une période de preuve en 2016 exécute par première fois la recolección massive de la domination .Il est avec des milieux propres. Pour réaliser cette recolección Réseau.Il est il extrait préalablement et il distribue le listage de dominations sur la base du listage complet de toutes les dominations enregistrés en ESNIC. Cette première recolección a supposé le gardé de 800.000 dominations, avec une limite de taille de 100 MB avec un total de 28 TB d'information.
Actuellement la massive de la domination .Il est il se réalise de façon annuelle, et il garde autour de 2.000.000 de dominations, avec une limite de taille de 150 MB et en stockant autour de 70 TB d'information, en réussissant garder plus de 80% des dominations de forme complète.
La recolección de la domination .gal Se réalise annuellement depuis 2017 en collaboration avec la Bibliothèque de la Galice, qu'il distribue le listage de dominations galiciennes qu'il extrait de l'établissement PuntoGal.
La première recolección garde plus de 4.000 dominations, avec 150 MB de profondeur et un total de 140 GB de mémoire stockés. Actuellement, il ramasse plus de 6.000 dominations et 280 GB d'information.
Les Archives du Web Espagnol il garde tu captures du premier site web qui a eu cette domination: http://www.dominio.gal
En 2022 la Bibliothèque Nationale de l'Espagne il réalise la première recolección de la domination .cat En collaboration avec la Bibliothèque de la Catalogne, que distribue le listage de dominations catalanes extraites de la Fondation puntCat.
La première recolección de la domination .cat Capture 44.000 dominations, avec une limite de 150 MB de taille par domination et il réussit décharger le 77 % d'ils de façon complète, obtenu les 2,5 TB d'information stockée.
En 2023 la Bibliothèque Nationale de l'Espagne il réalise la première recolección de la domination .eus En collaboration avec la Bibliothèque Digitale d'Euskadi, que distribue le listage de dominations à recolectar basques extraits de l'association PuntuEUS, que maintient cette domination.
La première recolección massive comprend plus de 13.000 dominations et 750 GB d'information, avec une limite de taille de 150 MB par domination.
Les sériées électroniques, spécialement les revues, sont sans lieu à des doutes, un des contenus les plus éphémères en Internet. Tous les ans se crear et ils disparaissent des publications sériées, beaucoup de de elles sans un équivalent imprimé, par ce que sa disparition est définitive et sa récupération impossible.
Les Archives du Web Espagnol il réalise, de façon massive et systématique, la recolección des sites web de ces publications sériées électroniques en libre accès, compris les exemplaires digitaux que ceux-ci contiennent, pour que se conservez et ils soient accessibles dans le futur même lorsque disparaissent du web vif.
La BNE comme Centre National de l'ISSN incorpore à son catalogue toutes les publications sériées électroniques espagnoles qui reçoivent ce nombre international et il est d'ici d'où il extrait les URL et des dominations pour lazar cette recolección massive.
Le premier gardé de sériées s'a réalisé en 2020 avec plus de 8.000 URL de sériées qu'ils comprenaient plus de 3.700 domination et avec une limite de taille d'un 1 GB par domination. ils actuellement se gardent plus de 10.000 sites web de sériées, appartenantes à 7.000 dominations en surpassant les 5 TB d'information stockée.