May, 2024

基于图像的字符识别,从寺庙解码铭文的文档系统

TL;DR该研究训练和分析应用于位于 Brihadeeswarar Temple 墙壁上发现的 10 世纪古代泰米尔铭文的光学字符识别(OCR)方法,其中选择的 OCR 方法包括使用现代 ICR 技术预处理原始数据的 Tesseract(一种广泛使用的 OCR 引擎)和一个框编辑软件来调优我们的模型,通过 Tesseract 的分析来评估它们在准确解读古代泰米尔字符方面的有效性,我们的模型在数据集上的性能通过准确率来确定,该数据集被划分为训练集和测试集,通过解决脚本的历史背景所带来的独特挑战,该研究旨在为 OCR 领域的改进保存和解释古代铭文做出有价值的贡献。