Aug, 2024

提升后OCR纠错:合成数据的比较研究

TL;DR本研究解决了后OCR纠错中合成数据应用的问题,提出了一种新算法,利用计算机视觉特征检测算法计算字形相似性以构建合成数据。研究表明,该算法能在低资源语言中显著降低字符错误率,且与传统方法相比,合成数据生成方法具有明显优势。