中世纪宪章的高效标注
本研究使用卷积神经网络来对文化遗产上雕刻或刻画成非常模糊的曲线结构进行自动分割,并通过实验证明了该算法在区分混杂曲线时的表现更为优秀。
Nov, 2017
该研究项目提出了一种基于字符分割的新方法,使用卷积神经网络识别字符和语言模型合成单词转录,从而为停泊罗斯的手写文档大量转录节省时间和努力。
Mar, 2018
通过降低虚假阳性和提高精确度的方法,我们在古代文献中增强了物体检测,并通过计算转换生成合成数据集,将视觉特征提取与物体检测过程相结合,进一步关联物体与其组成部分,并引入视觉特征图,从而深入分析和促进了有价值的历史文物,给古文字学领域带来了深远影响。
Jul, 2023
历史抄写员识别是获取过去信息的重要任务。本文展示了跨编码器训练数据对CNN基于文本无关离线识别历史抄写员的重要性,以克服编码器依赖过拟合。我们通过实验报告得出三个主要发现:首先,使用屏蔽灰度图像的预处理明显提高了分类结果的F1分数,而不是使用RGB图像。其次,我们使用不同的神经网络对复杂数据进行训练,验证时间和准确率之间的差异,以确定最可靠的网络架构。使用AlexNet,即在F1分数和时间之间取得最佳权衡的网络,我们在分类中在行级别上获得了高达0.96的F1分数,在页级别上获得了高达1.0的F1分数。第三,我们验证了通过实施拒绝选项可以进一步改善CNN输出,从而获得更稳定的结果。我们展示了我们的大规模开源数据集--Codex Claustroneoburgensis数据库(CCl-DB)--中的结果,包含了来自几种不同编码器的多个写手的大量写作。我们首次在具有如此多样化的编码器数据集上展示,使用CNN自动且准确地复现了古文献学决策。这为古文献学家提供了多种新快速获取未标记材料见解的方法,也有助于发展更多的假设。
Dec, 2023
19世纪的地籍是历史学家和考古学家的一个复杂且丰富的来源,使用时面临巨大挑战。我们使用卷积神经网络和视觉变换器训练了几个深度学习模型,从这种知识表示中提取大规模数据。我们在这里展示了我们工作的主要结果,并展示了我们基于浏览器的工具的演示,该工具使研究人员和公众利益相关者能够快速识别出19世纪弗朗西斯喜安地籍中具有建筑物的地点。这个工具不仅支持学者和研究人员更好地理解斯泰里亚地区的定居历史,还帮助公共行政机构和公民迅速确定文化遗产敏感区域。
Dec, 2023
通过光电测色扫描和深度分割网络的自动化处理,我们改善了古代艺术中费时且受损镜子的图像追踪和二值化方法,减轻了人工劳动,提高了预测性能以及与人类标注者相似的量化结果。
Apr, 2024
本文介绍了一种用于从以色列古物管理局(IAA)策划的图像中分割手稿碎片的定制流水线,并通过隔离和解决每个困难的定制方法来解决标尺、颜色、号码栏以及黑色背景等难题。此外,我们创建了一个带有条形码检测和碎片分割真值信息的数据集,并在该数据集上定性和定量地评估流水线步骤。该数据集公开可用,旨在解决碎片图像和评估指标的缺乏,并使研究人员能够以可靠且可重复的方式评估他们的方法。
Jun, 2024
本研究解决了中世纪书写类型分类的描述性限制和主观标准的问题,提出了一种基于可解释深度学习的形态脚本类型分析方法。该方法通过适应深度实例分割技术,学习可比的字符原型,系统性地提供了定性与定量的分析工具。研究结果为实现定性观察和定量测量之间的桥梁作出了重要贡献,展示了在Textualis Formata脚本类型及其两个亚型的应用效果。
Aug, 2024