使用 yolov8 计算机视觉模型的希伯来字母检测和楔形文字分类
基于深度学习和变分自编码器方法,针对库内容丰富的超过 94,000 张楔形文字片的数据集,通过研究其轮廓形状作为关键指标,成功实现了古代文献的自动分类和时代定位,为历史学家和铭刻学家提供了更深入的洞察和解释工具。
Jun, 2024
本研究使用基于图的两种方法和距离计算,分别是基于图编辑距离的分割算法和适应于图的 CNN,实现对楔形文字的自动识别和分类,两种方法分别在训练阶段和预测阶段具有不同的计算成本和实用价值。
Feb, 2018
通过数字化古代近东研究(DANES)社区的挑战,我们开发了用于处理楔形文字的数字工具,这是一种镌刻在泥板上的三维文字,使用了三千多年和至少八种主要语言。我们创建和使用了 HeiCuBeDa 和 MaiCuBeDa 数据集,包含约 500 个带注释的泥板。我们的新型 OCR 样式方法针对混合图像数据,提供了一种在三维渲染和照片之间转移注释的映射工具。我们使用 GigaMesh 的 MSII(曲率,参见此处链接)基于渲染、Phong 阴影的三维模型和照片以及光照增强的图像数据进行符号定位。结果显示,使用渲染的 3D 图像进行符号检测比其他研究使用的照片效果更好。此外,我们的方法在仅使用照片时也能得到合理的结果,但在混合数据集中效果最好。更重要的是,Phong 渲染,特别是 MSII 渲染,提高了照片的结果,这是全球规模最大的数据集。
Aug, 2023
我们的研究通过使用 YOLOv8 模型集合进行字符检测和分类,结合基于 transformer 的 DeiT 方法和使用 SimCLR 进行自监督学习的 ResNet-50 模型,获得了 ICDAR 2023 比赛的好成绩,并在 Oxyrhynchus Papyri 上展示了我们的方法的实用性。
Jan, 2024
玛雅象形文字的研究通过人工智能提供了一种新的透视方式,可以翻译这些铭文,有潜力让非专家阅读这些文本,并帮助解密那些仍无法全面解释的象形文字。我们利用基础模型从一个专注于玛雅文物的开源数字图书馆中分割玛雅象形文字,通过专家在玛雅艺术和历史方面的协助,精心策划了图像和标签配对,使这些基础模型的性能得到显著提高,展示了精调方法的潜力和我们不断扩大的数据集的价值。我们计划开源这一数据集,鼓励未来的研究,并最终帮助更广泛的社区阅读玛雅象形文字,特别是玛雅遗产社区的成员。
May, 2024
该研究提出了一种新的 “递归编码” 方法,以便计算机可以处理符号的笔画排列,从而解决楔形文字教学中检索未知符号的问题,并通过一系列新的算法使学生能够使用任何独特的组成部分来查找符号,并提供了电子形式呈现符号和文版的新方法。
Jun, 2024
本文介绍了一种楔形文字语言识别(CLI)数据集,并通过这个数据集进行了一些初步的语言识别实验。同时,提供了基线实验结果。据我们所知,这里详细介绍的实验是首次在楔形文字数据上使用自动语言识别方法。
Mar, 2019
该研究论文调查了脚本识别和文本识别的现有方法和技术,并讨论了在处理和识别脚本方面的技术改进,特别是针对印度的 12 种主要印度文字的复杂特征和高级预处理方法。
Aug, 2023
提出了一种基于国际音标的字符嵌入的生成框架,该框架可以处理未分隔单词和最接近的已知语言未确定的情况下,对未破译的失传语言进行解密,并在哥特语、乌加里特语和伊比利亚语上进行了实验验证。
Oct, 2020