Catalogación automatizada de materias en la Biblioteca Nacional de Alemania

Catalogación automatizada de materias en la Biblioteca Nacional de Alemania
9 de Mayo de 2025

Automatic Subject Cataloguing at the German National Library

Christoph Poley, Sandro Uhlmann, Frank Busse, Jan-Helge Jacobs, Maximilian Kähler, Matthias Nagelschmidt y Markus Schumacher

LIBER quarterly: the journal of the association of european research libraries, ISSN 2213-056X, vol. 35, n. 1, 2025, pp. 1-29.

La Biblioteca Nacional de Alemania (DNB) empezó a desarrollar soluciones para la catalogación automatizada 15 años atrás. El motivo principal para hacerlo fue el gran y creciente número de documentos en formato digital que tenían que ser indizados. En la actualidad, la DNB utiliza algoritmos y esquemas de código abierto para asignar así varios tipos de meta información temática. Este artículo práctico proporciona una visión más profunda de la catalogación de materias automatizada en la DNB. Observamos los datos y vocabularios utilizados, así como los diferentes métodos y enfoques. El vocabulario para la clasificación se basa en la Clasificación Decimal de Dewey (DDC). Para la indización temática verbal utilizamos la German Integrated Authority File (GND). El caso práctico de clasificación automatizada está dividido en la asignación de materias y números breves de la DDC. Debido al gran tamaño del vocabulario de la GND, el caso práctico de la indización automatizada es un problema de clasificación multietiqueta extrema (XMLC). Se ofrece un breve informe sobre la construcción y representación de nuestros modelos. En base a estos casos prácticos, presentamos algunos aspectos de implementación de nuestra “máquina de catalogación automatizada” EMa, el entorno para catalogación automatizada de materias en uso. Señalamos el conjunto básico de características y proporcionamos una introducción de alto nivel del sistema productivo EMa. Se describe el diseño modular de la arquitectura del software de EMa con el programa de código abierto Annif como herramienta central. El desarrollo de EMa es una tarea en marcha en la DNB. Requiere de un desarrollo y mantenimiento continuo, y recursos tecnológicos y de personal. Las actividades destinadas a la investigación del proyecto de Inteligencia Artificial de la DNB están estrechamente relacionadas con EMa, lo que garantiza que los descubrimientos científicos relevantes se integren en su desarrollo.

Traducción del resumen de la propia publicación

doi: https://doi.org/10.53377/lq.19422

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.