Aug, 2023
一个定制的中世纪拉丁手写文本识别系统
A tailored Handwritten-Text-Recognition System for Medieval Latin
Philipp Koch, Gilary Vera Nuñez, Esteban Garces Arias, Christian Heumann, Matthias Schöffel...
TL;DR拜仁学院的中世纪拉丁字典数字化工作,采用了端到端的流水线,包括定位、提取和转录手写词条等步骤。使用最新的图像分割模型准备初始数据集,并尝试不同的基于 Transformer 的模型进行实验,采用丰富的数据增强技术,最佳设置的字符错误率为 0.015,表现优于商业的谷歌云视觉模型并且更加稳定。