ICCVAug, 2023

基于卷积神经网络的楔形文字标志检测,使用带灯光增强的标注三维渲染和映射照片

TL;DR通过数字化古代近东研究(DANES)社区的挑战,我们开发了用于处理楔形文字的数字工具,这是一种镌刻在泥板上的三维文字,使用了三千多年和至少八种主要语言。我们创建和使用了 HeiCuBeDa 和 MaiCuBeDa 数据集,包含约 500 个带注释的泥板。我们的新型 OCR 样式方法针对混合图像数据,提供了一种在三维渲染和照片之间转移注释的映射工具。我们使用 GigaMesh 的 MSII(曲率,参见此处链接)基于渲染、Phong 阴影的三维模型和照片以及光照增强的图像数据进行符号定位。结果显示,使用渲染的 3D 图像进行符号检测比其他研究使用的照片效果更好。此外,我们的方法在仅使用照片时也能得到合理的结果,但在混合数据集中效果最好。更重要的是,Phong 渲染,特别是 MSII 渲染,提高了照片的结果,这是全球规模最大的数据集。