La BNE y el Centro Nacional de Supercomputación (BSC-CNS) desarrollan un protocolo de actuación conjunta con la IA como eje

Actividad cultural
Colecciones
Comunicación
Preservación
Servicios
La BNE y el Centro Nacional de Supercomputación (BSC-CNS) desarrollan un protocolo de actuación conjunta con la IA como eje
Protocolo dedicado a la promoción y difusión de proyectos culturales y científico-técnicos
16 de Junio, 2022

Se ha celebrado, en la Biblioteca Nacional de España, la segunda jornada de trabajo de la BNE y el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) para el desarrollo de un protocolo común de actuación dedicado a la promoción y difusión de proyectos culturales y científico-técnicos con la Inteligencia Artificial como eje.

En esta jornada - la primera se celebró en mayo en la sede del BSC-CNS en Barcelona – se han puesto en común las líneas de acción para el desarrollo de actividades y proyectos de interés para ambas instituciones y que estén relacionados con los fines que ambas tienen encomendadas. En este sentido destacan dos líneas principales de actuación:

  • El desarrollo e investigación de modelos del lenguaje a partir de los datos y colecciones de la BNE.
  • El desarrollo de casos de uso y aplicaciones tecnológicas que supongan nuevas formas de acceso, recuperación y reutilización de los recursos digitales de la Biblioteca Nacional de España.

El primer gran proyecto conjunto del BSC-CNS y la BNE es la creación del primer sistema masivo de Inteligencia Artificial de la lengua española, MarIA, que – apenas un año después de su lanzamiento - ya resume y genera textos por sí mismo. MarIA ha sido entrenado con más de 135 mil millones de palabras del archivo web de la BNE y está impulsado por la Secretaría de Estado de Digitalización e Inteligencia Artificial, dentro de los objetivos de la Estrategia Nacional de Inteligencia Artificial y del Plan de Recuperación.

Sobre el Barcelona Supercomputing Center

El Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS) es el centro líder de la supercomputación en España. Su especialidad es la computación de altas prestaciones, también conocida como HPC (High Performance Computing). Su función es doble: ofrecer infraestructuras y servicio en supercomputación a los científicos españoles y europeos, y generar conocimiento y tecnología para transferirlos a la sociedad.

El BSC-CNS es miembro de primer nivel de la infraestructura de investigación europea PRACE (Partnership for Advanced Computing in Europe) y gestiona la Red Española de Supercomputación (RES).

El Consorcio BSC está formado por el Ministerio de Ciencia e Innovación del Gobierno de España (60%), el Departament de Recerca i Universitats de la Generalitat de Catalunya (30%) y la Universitat Politècnica de Catalunya (10%).

Sobre el Archivo de la Web de la BNE

La BNE garantiza desde hace más de trescientos años la conservación del patrimonio bibliográfico español y su transmisión a las futuras generaciones. Su historia durante este largo periodo de tiempo ha sido paralela a la propia historia de nuestro país y sus colecciones reflejan la evolución de la creación literaria, el pensamiento, el arte, la música y la ciencia españoles.

El Archivo de la Web Española es una de las colecciones más recientes de la BNE. Está formada por los sitios web (incluidos blogs, foros, documentos, imágenes, vídeos, etc.) que se recolectan con el fin de preservar el patrimonio documental español en Internet y asegurar el acceso futuro al mismo.

La recolección de páginas web se realiza con robots rastreadores que recorren las URL seleccionadas previamente y guardan todo lo que encuentran enlazado, con la frecuencia, profundidad y tamaño que se determine. El resultado de estas recolecciones son los archivos web, que se guardan en formato WARC (de Web ARChive), un formato de archivo normalizado por la ISO. Una parte de estos ficheros WARC constituyen el corpus documental sobre el que se ha entrenado MarIA.

Contenidos relacionados
Colecciones
Archivo de la web española

Formada por los sitios web que se recolectan con el fin de preservar el patrimonio documental español en Internet