Chronicling America. Historic American Newspapers
Chronicling America es un repositorio de prensa digitalizada que está financiado por la National Endowment for the Humanities y la Library of Congress como parte del National Digital Newspaper Program (NDNP). Pueden visitarse las páginas de los periódicos publicados entre 1836 y 1922.
En 2019 se puso en marcha el proyecto Newspaper Navigation, centrado en la aplicación de técnicas de machine learning a sus contenidos. Comprende dos fases: la extracción de contenido visual (fotografías, ilustraciones, viñetas, tiras cómicas, mapas, titulares y anuncios) de sus más de 16 millones de páginas, y el desarrollo de una interfaz de búsqueda y exploración que permita al usuario navegar por todo ese material gráfico. Como resultado de la primera fase se publicó en abril de 2020 el Newspaper Navigator dataset, y la segunda se concretó en septiembre de 2020 en la publicación de la Newspaper Navigator search application. El modelo de aprendizaje automático que permitió generar este conjunto de datos se basó en los resultados de Beyond Words, un proyecto colaborativo en el que los usuarios de la colección ayudaron a identificar algunas imágenes seleccionadas. A estos datos se sumó la aplicación de técnicas avanzadas de reconocimiento visual y el uso de redes neuronales.
También se puede consultar el catálogo colectivo U.S. Newspaper Directory, 1690-Present que recoge la prensa editada en Estados Unidos desde 1690 hasta la actualidad.