Next-Generation data Management Plans: Global, Machine Actionable, FAIR
Stephanie Renee Simms, Sarah Jones
International Journal of Digital Curation, ISSN 1746-8256, vol. 12, n. 1, 2017, p. 36-45
Los plantes de gestión de datos son documentos obligatorios que describen los datos utilizados y producidos en experimentos científicos. Son documentos de formato libre cuya calidad depende tanto de la experiencia como de la meticulosidad de las personas que los redactas. La complejidad de los experimentos impulsados por datos requiere descripciones precisas de las herramientas y conjuntos de datos usado en las computaciones para permitir su reproductibilidad y reutilización.
Por lo tanto, se necesita una descripción automáticamente creada accionada por máquina de los experimentos que pueda mejorar la calidad de los planes de gestión de datos y reducir el esfuerzo de su preparación sin influir en las prácticas de investigación. Este problema fue reconocido por la comunidad de investigadores y fue discutido en conferencias y reuniones como la de la Research Data Alliance. En este artículo presentamos nuestro actual trabajo sobre la percepción del concepto de planes de gestión de documentos accionables por máquina. Analizamos las herramientas existentes en dominios de preservación digital, investigación reproducible, ciencia abierta y repositorios de datos que cubren el ciclo vital completo de los datos. Identificamos el mapeo de la lista del Digital Curation Centre, que es una agregación de los requisitos de los inversores y sirve como un modelo genérico de los planes de gestión de datos. Presentamos las lecciones aprendidas del mapeo y describimos las limitaciones de la automatización de la accionabilidad de las máquinas. Como resultado, definimos los requisitos de los planes de gestión de datos para máquinas accionables. Proponemos un modelo de datos que puede respaldar estos planes, permitiendo una integración flexible de la información. El modelo usa ontologías y está basada en planes de gestión reales. También aportamos una discusión de los beneficios y nuevas oportunidades representada por maDMPs. El futuro desarrollo se centra en comprometerse con los interesados de varias comunidades para iniciar estudios piloto en los que el modelo común propuesto sea extendido con los estándares de identificación. Esto requerirá el mapeo de estándares y tareas de ingeniería de software. Entonces evaluaremos el acercamiento propuesto. Informaremos a la comunidad a través de los grupos de trabajo de la RDA. Creemos que el éxito de los planes de gestión de datos accionables por máquina requiere el esfuerzo conjunto de la comunidad y de una amplia aceptación. Por este motivo monitorizaremos el trabajo y esperaremos nuevas colaboraciones.
Traducción del resumen de la propia publicación