Dec, 2023

OCR 的标度律实证研究

TL;DR通过对模型尺寸、数据量、计算和模型性能进行全面研究,在自然语言处理领域确定了它们之间的关系,然而在光学字符识别领域的标度律尚未被研究。本研究通过对模型性能、数据量和计算规模之间的关联进行详细研究,表明在控制其他影响因素的情况下,性能与模型尺寸以及训练数据量之间存在平滑的幂律关系。此外,研究人员构建了一个大规模数据集 REBU-Syn,包括 600 万真实样本和 1800 万合成样本。基于他们的比例定律和新数据集,他们成功训练了一个场景文字识别模型,在 6 个常见的测试基准上取得了 97.42% 的平均准确率,达到了新的最先进水平。