Facing the Challenge of Web Archives Preservation Collaboratively: The role and work of the IIPC Preservation Working Group
Andrea Goethals y otros
D-Lib Magazine, ISSN 1082-9873, Vol. 21, n. 5-6, 2015
La preservación de publicaciones como libros electrónicos, tesis en línea o publicaciones periódicas electrónicas es todavía un desafío para las bibliotecas digitales y archivos. Existen organizaciones culturales, agencias de gobierno y empresas que tienen la responsabilidad de recopilar y preservar este tipo de publicaciones. Uno de los problemas que esto plantea es el tratamiento de los diferentes formatos de ficheros. Para afrontar esta tarea, es necesario que todas las bibliotecas y archivos que hagan este trabajo tengan un personal preparado, unas políticas de preservación y que los sistemas de archivos sean conforme al modelo Open Archival Information System. Los archivos Web tienen unas especificidades determinadas que, en ocasiones, hace que no se les incluya en los planes de preservación.
Así, el objetivo del International Internet Preservation Consortium (IIPC), es cubrir la preservación de todo tipo de archivos web. Tienen una sección denominada Preservation Working Group (PWG) que nació con el IIPC en 2007, cuya función es describir los archivos web. Realizan métodos de identificación, estándares y prácticas ya utilizadas en otros ámbitos de los recursos digitales e informan como pueden ser usados en recursos web. Es por esto, que este grupo de trabajo, actúa como un foro de ideas e intercambio de opiniones. De esta actividad surgió la ISO Technical Report que pretende estandarizar las estadísticas y la calidad para el archivo web. Las herramientas de software que utiliza son identificación de formatos de ficheros (WARC format) y herramientas de extracción de metadatos. Junto a esta tarea, esta organización realiza encuestas entre los miembros del IIPC para mejorar las prácticas en su trabajo y contar con un punto de vista real del funcionamiento de estas instituciones participantes. En ellas, se incluyen preguntas sobre políticas, acceso, estrategias de preservación, ingesta, formatos de ficheros e integridad. Las conclusiones obtenidas destacan que dar acceso al archivo web es el objetivo principal de la preservación. En cuanto a la planificación y las estrategias, en la encuesta se muestra también que siguen faltando, con lo cual resulta difícil asegurar la conservación a largo plazo de los archivos. Realmente, el archivo web es un campo nuevo para bibliotecas y otras instituciones culturales y es un reto a desarrollar en la actualidad. El trabajo realizado por el esta sección se basa en la existencia de la colaboración y la documentación compartida, necesaria para continuar con la tarea de la preservación digital de la web.
Resumen elaborado por la Sección de Documentación Bibliotecaria