Aplicación del modelado de temas para la creación automática de metadatos descriptivos para colecciones digitales
Applying topic modeling for automated creation of descriptive metadata for digital collections
Monika Glowacka-Musial
Information technology and libraries, ISSN 2163-5226, Vol. 41, n. 2, 2022
Proponemos una forma de agilizar el flujo de trabajo de creación de metadatos para los comunicados de prensa universitarios aplicando el modelado de temas. En primer lugar, empleamos esta tecnología digital para identificar temáticas en una gran colección de documentos de texto. A continuación, asociamos los temas descubiertos con conjuntos de encabezamientos de materia. Por último, en un nuevo documento, asignamos los encabezamientos de materia que se asocian a los temas más predominantes del documento. El método propuesto facilita el proceso de anotación de documentos. Produce listas cortas de posibles encabezamientos de materia que constituyen una parte importante del etiquetado original realizado por catalogadores. Este enfoque puede aplicarse para facilitar la anotación de cualquier gran colección digital de documentos de texto. Una de las ventajas de aplicar el modelado de temas es que produce representaciones numéricas de los documentos de texto. Estas representaciones numéricas pueden ser utilizadas por metodologías analíticas avanzadas, incluido el aprendizaje automático, para numerosos fines prácticos en los flujos de trabajo de las bibliotecas, tales como la categorización de textos, la colocación de materiales similares, la mejora de los metadatos de las colecciones digitales, la búsqueda de tendencias en la literatura de publicaciones oficiales, etc. Además, el dominio de las metodologías digitales por parte de los bibliotecarios puede abrir nuevas vías de colaboración entre estos y los académicos digitales de los campus universitarios.
https://ejournals.bc.edu/index.php/ital/article/view/13799
Traducción de las conclusiones de la propia publicación