Reordenación de resultados en la búsqueda de catálogos de bibliotecas públicas mediante Learning to Rank

Page content

Reordenación de resultados en la búsqueda de catálogos de bibliotecas públicas mediante Learning to Rank

Reranking Hits in Public Library Catalog Search with Learning to Rank

Michael Preminger y Henrik Holtvedt Andersen

Cataloging & Classification Quarterly, ISSN-e 1544-4554, vol. 63, n. 8, 2025, pp. 668-683

La mayoría de los sistemas de búsqueda en bibliotecas implementan la indexación de texto completo de los metadatos para ofrecer funciones básicas de búsqueda en los catálogos en línea de acceso público (OPAC), y los usuarios reciben resultados ordenados según la relevancia de estos, de manera similar a otras interfaces de búsqueda, como los motores de búsqueda web. Sin embargo, el ranking de los resultados en la búsqueda bibliotecaria es más complejo. Los títulos en los sistemas bibliotecarios están poco representados - basados principalmente en metadatos- y las necesidades de información de los usuarios suelen estar poco definidas. En este artículo se propone el aprendizaje automático para aliviar este problema, y más específicamente la tecnología Learning to Rank (LTR), un enfoque de aprendizaje automático supervisado destinado a ordenar elementos en función de su relevancia respecto a una consulta o necesidad concreta. Para ello, se entrenaron modelos usando tres conjuntos de características y dos algoritmos Listwise, con los hiperparámetros por defecto de la biblioteca RankLib. La evaluación, basada en los cambios acaecidos en el ranking de los resultados seleccionados, indica que LTR tiene un gran potencial para mejorar la relevancia de los resultados y mejorar la clasificación de materiales en un OPAC. Cada vez más bibliotecas públicas adoptan sistemas bibliotecarios de código abierto, como KOHA, que permiten integrar tecnologías de búsqueda avanzadas como LTR. Esto podría facilitar la centralización del entrenamiento de modelos y hacer la tecnología accesible incluso para bibliotecas más pequeñas, mientras que en sistemas propietarios el esfuerzo puede ser mayor según las particularidades del software.

https://doi.org/10.1080/01639374.2025.2562075

Artículo a texto completo bajo suscripción. Accesible desde la BNE

Comentarios

CAPTCHA