Text and data Mining: Searching for Buried Treasures

Text and data Mining: Searching for Buried Treasures
18 de Junio de 2015

Sharin Dyas-Correia y Michelle Alexopoulos

Serials Review, ISSN 1879-095X, Vol. 40, n. 3, 2014, p. 210-216

 

La minería de datos es una importante herramienta de búsqueda para muchas disciplinas, y crece en importancia en los últimos años. Sobre ella existen muchas definiciones. Algunas están basadas en la extracción de significado de textos y como campo interdisciplinar con la combinación de técnicas de lingüística, informática y estadísticas. En otros casos, inciden en el proceso de gestionar grandes cantidades de datos digitales o textuales para recuperación, extracción, interpretación y análisis de dichos datos.

La importancia de esta técnica, en la actualidad, se debe a varios factores, como la enorme cantidad de literatura producida y la mejora e incremento de las herramientas usadas para este fin. Proyectos destacados de digitalización en el ámbito de los libros han servido para el comienzo de esta técnica de análisis de textos. También se ha utilizado en el ámbito de la economía, finanzas, ciencias políticas y medicina. Algunos de los recursos analizados en la minería de datos pertenecen, tradicionalmente, al entorno de las colecciones bibliotecarias, pero otros derivan de herramientas de redes sociales (por ejemplo Twitter), metadatos, patentes y material de ámbito jurídico que requieren un acceso seguro. En el mercado existen multitud de herramientas que pueden ser utilizadas también por los bibliotecarios pero vienen encapsuladas, es decir, son productos que no se adaptan a un ámbito concreto. Por ello, éstos demandan productos a medida para sus necesidades específicas como por ejemplo la búsqueda de formatos específicos de datos que eviten el uso de programas automáticos. Los editores, bibliotecas e investigadores realizan las actividades de minería con materiales de acceso abierto pero se puede necesitar la obtención de los correspondientes permisos lo cual implica la existencia de costes económicos. Además, comportan problemas como que el investigador no sea informado de todas las licencias firmadas entre las bibliotecas y otros colaboradores, y, si el volumen de información o estadísticas conlleva un uso excesivo de los recursos de un ordenador, el editor o proveedor puede no acceder, o limitar el acceso a sus fuentes. Como solución, instituciones, gobiernos y asociaciones estudian una licencia de derecho de autor para la minería de datos o clausulas especiales de acceso. De todo lo expuesto, se puede concluir que hay un crecimiento significativo de las herramientas sobre minería de datos y que las bibliotecas tendrán un activo papel en proveer servicios y crear soluciones en esta área.

 

Resumen realizado por la Sección de Documentación Bibliotecaria

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.