中世纪宪章的高效标注

Jun, 2023

Efficient Annotation of Medieval Charters

Anguelos Nicolaou, Daniel Luger, Franziska Decker, Nicolas Renet, Vincent Christlein...

TL;DR本文提出了一种基于目标检测的有效和高效的特许证书分割标注方法，相较与像素级别分割方法，该方法可更有效地利用古文书专家的时间，并在某些情况下取得了更好的结果。同时，通过利用图像中的校准卡来标注物理尺寸，还训练了回归神经网络来预测其图像补丁。本文的实验还揭示了如何设计一个类本体以充分利用标注人员的时间和精力。

Abstract

diplomatics, the analysis of medieval charters, is a major field of research in which paleography is applied. Annotating data, if performed by laymen, needs validation and correction by experts. In this paper, we

发现论文，激发创造

基于CNN的深度图曲线-结构分割及其在文物探索中的应用

本研究使用卷积神经网络来对文化遗产上雕刻或刻画成非常模糊的曲线结构进行自动分割，并通过实验证明了该算法在区分混杂曲线时的表现更为优秀。

Nov, 2017

探索梵蒂冈秘密档案中的知识发现——《In Codice Ratio》第一集：手稿的机器转录

该研究项目提出了一种基于字符分割的新方法，使用卷积神经网络识别字符和语言模型合成单词转录，从而为停泊罗斯的手写文档大量转录节省时间和努力。

Mar, 2018

通过模型编辑提高数据有效性化石分割

使用模型编辑技术和领域知识来提高少数标记图像的化石图像分割，可以在没有额外标记数据的情况下改善不同类型化石的混淆。

Oct, 2022

利用合成数据生成和基于Transformer的模型提升古籍文档中的物体检测

通过降低虚假阳性和提高精确度的方法，我们在古代文献中增强了物体检测，并通过计算转换生成合成数据集，将视觉特征提取与物体检测过程相结合，进一步关联物体与其组成部分，并引入视觉特征图，从而深入分析和促进了有价值的历史文物，给古文字学领域带来了深远影响。

Jul, 2023

AutArch: 考古目录中物体检测和自动记录的AI辅助工作流

通过人工智能的对象检测神经网络技术，在考古学目录中快速、自动和标准化地收集数据，同时记录几何整体轮廓。

Nov, 2023

中世纪手稿可靠抄写者识别的跨码学习

历史抄写员识别是获取过去信息的重要任务。本文展示了跨编码器训练数据对CNN基于文本无关离线识别历史抄写员的重要性，以克服编码器依赖过拟合。我们通过实验报告得出三个主要发现：首先，使用屏蔽灰度图像的预处理明显提高了分类结果的F1分数，而不是使用RGB图像。其次，我们使用不同的神经网络对复杂数据进行训练，验证时间和准确率之间的差异，以确定最可靠的网络架构。使用AlexNet，即在F1分数和时间之间取得最佳权衡的网络，我们在分类中在行级别上获得了高达0.96的F1分数，在页级别上获得了高达1.0的F1分数。第三，我们验证了通过实施拒绝选项可以进一步改善CNN输出，从而获得更稳定的结果。我们展示了我们的大规模开源数据集--Codex Claustroneoburgensis数据库（CCl-DB）--中的结果，包含了来自几种不同编码器的多个写手的大量写作。我们首次在具有如此多样化的编码器数据集上展示，使用CNN自动且准确地复现了古文献学决策。这为古文献学家提供了多种新快速获取未标记材料见解的方法，也有助于发展更多的假设。

Dec, 2023

基于人工智能的历史地籍图结构检测与信息提取（19世纪初斯蒂里亚省方济各会地籍）与当前高分辨率卫星航拍图像用于遥感

19世纪的地籍是历史学家和考古学家的一个复杂且丰富的来源，使用时面临巨大挑战。我们使用卷积神经网络和视觉变换器训练了几个深度学习模型，从这种知识表示中提取大规模数据。我们在这里展示了我们工作的主要结果，并展示了我们基于浏览器的工具的演示，该工具使研究人员和公众利益相关者能够快速识别出19世纪弗朗西斯喜安地籍中具有建筑物的地点。这个工具不仅支持学者和研究人员更好地理解斯泰里亚地区的定居历史，还帮助公共行政机构和公民迅速确定文化遗产敏感区域。

Dec, 2023

勾勒界线：深度分割用于提取古埃特鲁里亚镜中的艺术

通过光电测色扫描和深度分割网络的自动化处理，我们改善了古代艺术中费时且受损镜子的图像追踪和二值化方法，减轻了人工劳动，提高了预测性能以及与人类标注者相似的量化结果。

Apr, 2024

为科学图像集分割死海古卷片段

本文介绍了一种用于从以色列古物管理局（IAA）策划的图像中分割手稿碎片的定制流水线，并通过隔离和解决每个困难的定制方法来解决标尺、颜色、号码栏以及黑色背景等难题。此外，我们创建了一个带有条形码检测和碎片分割真值信息的数据集，并在该数据集上定性和定量地评估流水线步骤。该数据集公开可用，旨在解决碎片图像和评估指标的缺乏，并使研究人员能够以可靠且可重复的方式评估他们的方法。

Jun, 2024

可解释的深度学习方法用于形态脚本类型分析

本研究解决了中世纪书写类型分类的描述性限制和主观标准的问题，提出了一种基于可解释深度学习的形态脚本类型分析方法。该方法通过适应深度实例分割技术，学习可比的字符原型，系统性地提供了定性与定量的分析工具。研究结果为实现定性观察和定量测量之间的桥梁作出了重要贡献，展示了在Textualis Formata脚本类型及其两个亚型的应用效果。

Aug, 2024