Estrategias de búsqueda exploratoria y dirigida en un archivo de datos de ciencias sociales
Sara Lafia , A.J. Million y Libby Hemphill
IASSIST Quarterly, ISSN 2331-4141, Vol. 48, n. 1, 2024
La ciencia abierta precisa de la compartición de datos y los investigadores necesitan métodos eficaces de búsqueda para descubrirlos y reutilizarlos. Este trabajo estudia las estrategias de búsqueda utilizadas por los usuarios de una base de datos de ciencias sociales con el objeto de promover el intercambio científico. Mediante la recopilación de consultas únicas realizadas a lo largo de cuatro años (entre 2012 y 2016), se analizan las estrategias de descubrimiento empleadas por los usuarios de la web del Consorcio Interuniversitario para la Investigación Política y Social (ICPSR) de la Universidad de Michigan (EEUU), para un conjunto de 1.554 consultas más populares. Se identifican cinco categorías de consultas más frecuentes: basadas en palabras clave (fecha, lugar, tema…); nombre (estudio, serie…); identificador (estudio, serie…); autor (institucional, individual…); y tipo (archivo, formato…). Aunque la estrategia de búsqueda dominante utiliza palabras clave cortas para explorar temas, también son frecuentes las búsquedas dirigidas de elementos conocidos utilizando nombres de estudios y series. Además, se diferencia entre las búsquedas exploratorias y las búsquedas dirigidas, en función de las páginas consultadas, los refinamientos, la profundidad de la búsqueda, la duración y la longitud: las consultas dirigidas son más largas (incluyen más palabras), mientras que las sesiones con consultas exploratorias tienen más refinamientos y más páginas vistas. Se indica que, al comparar las interacciones de búsqueda en el ICPSR con otras interacciones de lenguaje natural en webs similares, la búsqueda de conjuntos de datos en el ICPSR está infrautilizada y las formas en que los usuarios consultan el sistema son limitadas. Se prevé que al mejorar los paradigmas de búsqueda alternativos -como los que permiten los sistemas de recomendación- se podrá mejorar la búsqueda de conjuntos de datos. Se concluye que el comportamiento de los usuarios en los registros del ICPSR sugiere que la búsqueda en el sitio se utiliza como punto de entrada para la exploración de datos. Estas estrategias son aún incipientes, pero a medida que la tecnología madure, la complejidad y la longitud de las consultas en lenguaje natural podrán parecerse más a las de las búsquedas en Internet.