中世纪手稿可靠抄写者识别的跨码学习

Dec, 2023

中世纪手稿可靠抄写者识别的跨码学习

Cross-codex Learning for Reliable Scribe Identification in Medieval Manuscripts

Julius Weißmann, Markus Seidl, Anya Dietrich, Martin Haltrich

TL;DR历史抄写员识别是获取过去信息的重要任务。本文展示了跨编码器训练数据对CNN基于文本无关离线识别历史抄写员的重要性，以克服编码器依赖过拟合。我们通过实验报告得出三个主要发现：首先，使用屏蔽灰度图像的预处理明显提高了分类结果的F1分数，而不是使用RGB图像。其次，我们使用不同的神经网络对复杂数据进行训练，验证时间和准确率之间的差异，以确定最可靠的网络架构。使用AlexNet，即在F1分数和时间之间取得最佳权衡的网络，我们在分类中在行级别上获得了高达0.96的F1分数，在页级别上获得了高达1.0的F1分数。第三，我们验证了通过实施拒绝选项可以进一步改善CNN输出，从而获得更稳定的结果。我们展示了我们的大规模开源数据集--Codex Claustroneoburgensis数据库（CCl-DB）--中的结果，包含了来自几种不同编码器的多个写手的大量写作。我们首次在具有如此多样化的编码器数据集上展示，使用CNN自动且准确地复现了古文献学决策。这为古文献学家提供了多种新快速获取未标记材料见解的方法，也有助于发展更多的假设。

Abstract

historic scribe identification is a substantial task for obtaining information about the past. Uniform script styles, such as the Carolingian minuscule, make it a difficult task for classification to focus on meaningful features. Therefore, we demonstrate in this paper the importance o

发现论文，激发创造

探索梵蒂冈秘密档案中的知识发现——《In Codice Ratio》第一集：手稿的机器转录

该研究项目提出了一种基于字符分割的新方法，使用卷积神经网络识别字符和语言模型合成单词转录，从而为停泊罗斯的手写文档大量转录节省时间和努力。

Mar, 2018

使用深度学习恢复古代文本：以希腊铭文为案例研究

这篇论文介绍了 Pythia，它是第一个使用深度神经网络从损坏的文本中恢复缺失字符的古代文本修复模型，在 PHI-ML 上实现了 30.1% 的字符错误率并在古代文字修复领域达到了最新水平。

Oct, 2019

OTS：一种用于历史手稿文本定位的单次学习方法

通过一种新颖的一次学习文本定位方法，即One-shot learning-based Text Spotting (OTS)方法，该方法结合了认知研究中的方法，通过空间对齐模块来找到并学习查询图像中最具有区分性的空间区域。同时，引入一种名为环形损失（Torus loss）的新型损失函数，使得嵌入距离空间更具有区分性。我们自己创建了包含古代东巴象形文字的手稿数据集，并在公开数据集上进行了实验，结果表明该方法在一次性文本定位方面优于现有方法。通过OTS方法，有望在历史手稿文本识别方面有更好的应用。

Apr, 2023

如何选择预训练的手写识别模型用于单作者微调

通过对大型基准数据集和通过手写文本生成模型产生的合成数据集的研究，本文提出在大数据集上预训练手写文本识别模型，并在少量带有个人特点手写的小规模数据集上进行微调，以有效转录手稿。

May, 2023

一个定制的中世纪拉丁手写文本识别系统

拜仁学院的中世纪拉丁字典数字化工作，采用了端到端的流水线，包括定位、提取和转录手写词条等步骤。使用最新的图像分割模型准备初始数据集，并尝试不同的基于Transformer的模型进行实验，采用丰富的数据增强技术，最佳设置的字符错误率为0.015，表现优于商业的谷歌云视觉模型并且更加稳定。

Aug, 2023

深度亚拉姆语：实现合成数据范式，在铭文学中开启机器学习

我们的研究通过合成数据的方法，为古代亚述文字符号生成了大规模的数据集，以此训练人工神经网络以提高掌握这些古代碑文的能力。通过验证实验，我们验证了该模型在处理多样的真实场景中的能力，并证明了我们合成数据方法的可行性，避免了对稀缺的训练数据的依赖，从而提高了对受损碑文的解读准确性和对历史资源的知识提取。

Oct, 2023

地面真实性对手写识别的影响

手写识别是访问古代手稿内容的关键技术，有助于保护文化遗产。深度学习在解决这一任务上表现出色，但要充分发挥其潜力，需要大量标记的数据，这在获取古代语言和文字方面是困难的。本文研究了对齐过程引入的系统性错误对训练和评估结果的影响，并提出了检测和纠正典型对齐错误的方法。

Dec, 2023

使用YOLOv8，DeiT和SimCLR在希腊纸上检测和识别字符

我们的研究通过使用YOLOv8模型集合进行字符检测和分类，结合基于transformer的DeiT方法和使用SimCLR进行自监督学习的ResNet-50模型，获得了ICDAR 2023比赛的好成绩，并在Oxyrhynchus Papyri上展示了我们的方法的实用性。

Jan, 2024

利用RNN提升数字化科普蒂克手稿中的文本补全方法

本论文介绍了一种用于预测古老手稿中科普特文字符的双向RNN模型，尽管在恢复文字缺失的过程中准确率下降，但能够帮助学者对Coptic手稿的文字重建进行排名，从而增强传统的文本恢复方法。

Jul, 2024

可解释的深度学习方法用于形态脚本类型分析

本研究解决了中世纪书写类型分类的描述性限制和主观标准的问题，提出了一种基于可解释深度学习的形态脚本类型分析方法。该方法通过适应深度实例分割技术，学习可比的字符原型，系统性地提供了定性与定量的分析工具。研究结果为实现定性观察和定量测量之间的桥梁作出了重要贡献，展示了在Textualis Formata脚本类型及其两个亚型的应用效果。

Aug, 2024