Aplicación del modelado de temas para la creación automática de metadatos descriptivos para colecciones digitales

Aplicación del modelado de temas para la creación automática de metadatos descriptivos para colecciones digitales
15 de Septiembre de 2022

Applying topic modeling for automated creation of descriptive metadata for digital collections

Monika Glowacka-Musial

Information technology and libraries, ISSN 2163-5226, Vol. 41, n. 2, 2022

Proponemos una forma de agilizar el flujo de trabajo de creación de metadatos para los comunicados de prensa universitarios aplicando el modelado de temas. En primer lugar, empleamos esta tecnología digital para identificar temáticas en una gran colección de documentos de texto. A continuación, asociamos los temas descubiertos con conjuntos de encabezamientos de materia. Por último, en un nuevo documento, asignamos los encabezamientos de materia que se asocian a los temas más predominantes del documento. El método propuesto facilita el proceso de anotación de documentos. Produce listas cortas de posibles encabezamientos de materia que constituyen una parte importante del etiquetado original realizado por catalogadores. Este enfoque puede aplicarse para facilitar la anotación de cualquier gran colección digital de documentos de texto. Una de las ventajas de aplicar el modelado de temas es que produce representaciones numéricas de los documentos de texto. Estas representaciones numéricas pueden ser utilizadas por metodologías analíticas avanzadas, incluido el aprendizaje automático, para numerosos fines prácticos en los flujos de trabajo de las bibliotecas, tales como la categorización de textos, la colocación de materiales similares, la mejora de los metadatos de las colecciones digitales, la búsqueda de tendencias en la literatura de publicaciones oficiales, etc. Además, el dominio de las metodologías digitales por parte de los bibliotecarios puede abrir nuevas vías de colaboración entre estos y los académicos digitales de los campus universitarios.

https://ejournals.bc.edu/index.php/ital/article/view/13799

Traducción de las conclusiones de la propia publicación

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.