Jun, 2024

关注空白:基于Transformer的转录分析

TL;DR本研究使用基于转换器的光学字符识别(OCR)模型,在合成数据中训练包含缺损的情况,以监督的方式检测和恢复文档中的缺损,成功率达到65%,相比不具备缺损知识的基础模型只能恢复5%。此外,我们还研究了模型的机制属性,如转录的对数概率,可以在不直接审查图像的情况下识别缺损和其他错误,这对于学者来说具有重要价值,可以区分包含缺损或错误的图像与干净的图像。我们的研究指出了利用基于转换器的OCR模型恢复或分析损坏历史文献的有希望的方向。