Aug, 2023

一个定制的中世纪拉丁手写文本识别系统

TL;DR拜仁学院的中世纪拉丁字典数字化工作,采用了端到端的流水线,包括定位、提取和转录手写词条等步骤。使用最新的图像分割模型准备初始数据集,并尝试不同的基于 Transformer 的模型进行实验,采用丰富的数据增强技术,最佳设置的字符错误率为 0.015,表现优于商业的谷歌云视觉模型并且更加稳定。