Bilketa masiboek
Helburua jabari osoa, aztertu diren recolecciones masiboak bat bazterketarik gabe. Robota da, hor ez dio biltzaile domeinuen zerrenda ematen du, eta artxibatu egingo da, edukia guztiak erregistratutako arakatzen du bidean aurkitzen duen, aurrez zehaztutako konfigurazioa.
Ez dago recolecciones masiboak dira aukeratzea, iragazkia, alborapena edo subjektibotasuna liburutegi edozein.
Webguneko artxiboan gordetzen gaur egun Espainiako lau eremu nazionalak: .es, .gal, .cat .eus., urtean behin Egiten du lankidetza-zentro bat, gainera, gorde Egiten da kontserbazio autonomikoak. urtean argitalpen seriatuak, interneteko sarbide librea masiboa.
Kontsultatu diren recolecciones masiboak gordetako eduki posiblea URL bidez.
.Es domeinuaren piperraren uzta bilketaren urtero egiten da, 2009az geroztik eta lortu nahi da ikuspegi orokorra urtero herriko web.
2009 Eta 2013 artean egin ziren 8 recolecciones masiboen .es domeinuaren bidez. Horiek dira azpiegitura irudikapen zaharrena recolecciones Internet Archive web guneen Webguneko artxiboan gordeko ditu.
2014An, espainiako liburutegi nazionalak bere azpiegiturako hartzen biltze eta proba-aldi baten ondoren exekutatzen 2016 lehen aldiz masiboki bilketa .es domeinuaren aldundiaren baliabideekin. Hori egiteko, aldez aurretik hornitzen domeinuen zerrenda ateratzen Red.es biltzea oinarrituta erregistratutako domeinu guztien zerrenda jaso genuen lehen aldikoa 800.000 izan. Hori ESNIC gordetako domeinuak, tamaina-muga 100 MB-ko TB, guztira, 28.
Gaur egun, urtero egiten da, eta gorde masiboki .es domeinuaren inguruan domeinuen 2.000.000, tamaina-muga 150 MB-ko TB 70 inguruan informazioa gorde eta gorde ditzake, eta% 80 baino gehiago domeinuak erabat.
Jabari .gal piperraren uzta bilketaren urtetik egiten da, liburutegiarekin lankidetzan 2017 honetan, zeinak galiziako domeinuen zerrenda hornitzen erakundearen erauzten dituen galiziako PuntoGal.
Jaso genuen lehen aldikoa, 150 MB-ko sakonerako eta 4.000 baino gehiago gordetzen domeinu, 140 GB-eko memoria. Gaur egun, 6.000 domeinuak eta 280 GB baino gehiago biltzen ditu gordetako informazioa.
Webguneko artxiboan gordetzen lehen Espainiako harrapaketak web gune honek izan zuen http://www.dominio.gal jabaria:
2022, Espainiako liburutegi nazionalaren jaso genuen lehen aldikoa .cat domeinuaren egiten liburutegiarekin lankidetzan jardunez, kataluniako domeinuen zerrenda ematen duen kataluniako fundazioaren ateratako puntCat.
.Cat domeinuaren jaso genuen lehen aldikoa argazkiak ateratzeko, eta muga alde batera utzita, 44.000 domeinu 150 MB jabari eta lortu% 77 deskargatu, 2,5 gordetako informazioa lortu ere bai.
2023, Espainiako liburutegi nazionalaren lehen biltzea .eus domeinua elkarlanean, euskadiko liburutegi digitala hornitzen duen domeinuen zerrenda biltzen eta naturatik erauzitako lehengaien, domeinu honek euskal PuntuEUS elkartea.
Jaso genuen lehen aldikoa masiboa, 13.000 baino gehiago biltzen ditu, eremu eta 750 GB-KO tamaina-muga 150 MB-ko.
Dira, eta, bereziki, aldizkariak, elektronikoak dira, zalantzarik gabe eduki iragankorrak interneten. Urtero sortzen eta desagertzen dira argitalpen seriatuak, horietako asko baliokide bat, eta, hori dela eta, behin betiko desagertu gabe inprimakia eta zaharberritzea.
Webguneko artxiboan egiten, eta, modu masiboan biltzea Espainiako web guneetako argitalpen horiek sarbide askeko elektronikoak barne, ale digitalen kontserbatzen badira, eta, eskura dituzten horiek etorkizunean nahiz web atmosferatik beren kasa ezabatzen.
La BNE ISSN zentro gisa sartu ditu bere estatuko aldizkari elektronikoetako guztiak jasotzen duten nazioarteko zenbaki hori espainiako katalogoa da han-hemen urlekin eta dominioen ateratzen eta egiteko hori lazar bilketa masiboa.
Lehen gordetako seriatuen baino gehiago egin zen 2020 8.000 seriatuen 3.700 jabari eta baino gehiagotan egitekoak ziren URL tamaina-muga 1 GB gordetzen dira. Gaur Egun bat, 10.000 web guneak, 7.000 domeinu 5 TB seriatuen gainditu gordetako informazioa.