Sep, 2022

未登录词挑战报告

TL;DR本文介绍了 Out-Of-Vocabulary 2022 (OOV) 挑战的最终结果。通过这个挑战,我们发现了一种非常重要的问题,即识别在OCR模型的训练数据集中未见过的现场文本实例。通过构建一个包含326,385个图像的公共数据集,本次挑战收集了4,864,405个场景文本实例,形成了独立的验证和测试集。通过对结果进行深入分析,我们发现当前最先进的模型在新的学习设置下性能略逊。因此,OOV数据集将是未来发展更具弹性和更加通用预测的场景文本模型的必要研究领域。