La transcripción automática de documentos impresos antiguos. Notas para un modelo de reconocimiento de caracteres en cursiva

La transcripción automática de documentos impresos antiguos. Notas para un modelo de reconocimiento de caracteres en cursiva
5 de Diciembre de 2024

La trascrizione automática di documenti a stampa antichi. Appunti per un modelo di riconoscimento della tipografía in corsivo 

 

Stefano Bazzaco

Digitalia, ISSN 1972-6201, V. 19, n. 1 (2024), pp. 63-86

 

El objetivo de esta contribución es describir el flujo de trabajo que condujo a la creación de un modelo de Handwritten Text Recognition (HTR) para la transcripción automática de textos venecianos del siglo XVI en escritura cursiva. En la primera parte, se define el ámbito del estudio, donde se analiza el estado de la técnica y los avances recientes en el campo del HTR en relación con escrituras complejas, es decir, textos impresos y manuscritos antiguos que, por sus características, dificultan la aplicación de los sistemas tradicionales de reconocimiento óptico de caracteres (OCR). En la segunda parte, se exponen las principales fases del trabajo de entrenamiento de la herramienta para la creación del modelo Italics_VeniceXVIs, que constituye un primer paso para la interpretación de textos caballerescos en cursiva de interés para el Proyecto Mambrino de la Universidad de Verona. Por último, se identifican las principales características del modelo y, con vistas a su accesibilidad y reutilización, se esbozan los pasos futuros del proyecto, donde se sugieren posibles vías de investigación relacionadas con otras áreas de estudio.

 

Traducción del resumen de la propia publicación

https://doi.org/10.36181/digitalia-00094 

 

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.