一种跨字体图像检索网络用于识别未解读的甲骨文
使用大量自我监督训练的视觉变换器(ViT),通过对数字化字体进行增强,开发了一种可扩展的方法来测量OCR文档的字符替换成本。使用字符表示之间的余弦距离作为编辑距离匹配算法中的替换成本,与其他广泛使用的字符串匹配方法相比,可以显著提高记录链接的精度,因为OCR错误往往是同形异义字的。 通过创建古代汉字的同形异义字集合,可以捕捉古代社会不同抽象概念的关系。
May, 2023
历史抄写员识别是获取过去信息的重要任务。本文展示了跨编码器训练数据对CNN基于文本无关离线识别历史抄写员的重要性,以克服编码器依赖过拟合。我们通过实验报告得出三个主要发现:首先,使用屏蔽灰度图像的预处理明显提高了分类结果的F1分数,而不是使用RGB图像。其次,我们使用不同的神经网络对复杂数据进行训练,验证时间和准确率之间的差异,以确定最可靠的网络架构。使用AlexNet,即在F1分数和时间之间取得最佳权衡的网络,我们在分类中在行级别上获得了高达0.96的F1分数,在页级别上获得了高达1.0的F1分数。第三,我们验证了通过实施拒绝选项可以进一步改善CNN输出,从而获得更稳定的结果。我们展示了我们的大规模开源数据集--Codex Claustroneoburgensis数据库(CCl-DB)--中的结果,包含了来自几种不同编码器的多个写手的大量写作。我们首次在具有如此多样化的编码器数据集上展示,使用CNN自动且准确地复现了古文献学决策。这为古文献学家提供了多种新快速获取未标记材料见解的方法,也有助于发展更多的假设。
Dec, 2023
提出了一种新的无监督领域适应方法,通过伪标签和约束增强一致性,从标记的人工手写神谕字符向未标记的扫描数据中传递知识,使模型在磨损、污渍和失真下更加鲁棒。同时,提出了一种无监督的转移损失,通过优化类间和类内转移概率,在扫描领域上学习更有辨别力的特征。大量实验表明,我们的方法在Oracle-241数据集上实现了最先进的结果,并且在最近提出的结构纹理分离网络上性能提升了15.1%。
Dec, 2023
利用扩散模型生成足够可控的甲骨文字,通过样式编码器和内容编码器控制风格和内容信息,有效提高图像生成和识别准确性。
Dec, 2023
通过构建一个包含13,714个不同字符类别的含有229,170张图片的EVolution Oracle Bone Characters (EVOBC)数据集,本研究展示了该数据集在辅助研究甲骨文上的作用,通过研究字符形式的演变来帮助解读甲骨文。
Jan, 2024
创造了华中科技大学甲骨学数据集,包括77,064张已解码甲骨文字图像和62,989张未解码字符的图像,共计140,053张图像,为未知甲骨文字的解码研究提供了帮助。
Jan, 2024
通过采用图像生成技术,本文引入了一种新颖的方法,即通过开发Oracle Bone Script Decipher (OBSD)——一种基于条件扩散策略的图像生成方法,为Oracle Bone Script(OBS)解密提供重要线索,为古代语言的人工智能辅助分析开辟了新的道路。
Jun, 2024
通过使用Puzzle Pieces Picker(P$^3$)这一新颖方法进行基体重建,该研究旨在解密大量未解谜的甲骨文,以揭示这种古老文字的秘密,并通过开发Ancient Chinese Character Puzzles(ACCP)数据集,能够更好地理解中国古代文字的历史和文化背景。
Jun, 2024
这篇论文提出了一个Oracle Bone Inscriptions多模态数据集(OBIMD),其中包括10,077块甲骨的注释信息,为早期商代历史和古文字学的研究提供了全面而高质量的注释级别。该数据集可以用于OBI领域相关的各种人工智能研究任务,如甲骨文字的检测和识别,擦拭去噪,文字匹配,文字生成,阅读序列预测,缺失字符补充等。我们相信这样一个数据集的创建和发布将有助于显著推进人工智能算法在OBI研究领域的应用。
Jul, 2024