Nov, 2023

泥地间的阅读:一个具挑战性的摩托车赛车手编号数据集

TL;DR本文介绍了离线摩托车 Racer 编号数据集 (RnD),这是一个针对光学字符识别 (OCR) 研究的新的具有挑战性的数据集。RnD 包含来自专业摩托车赛车摄影师的 2,411 张图像,展示了越野比赛中的摩托车赛车手。该数据集具有使 OCR 变得困难的各种因素,包括泥浆遮挡、动态模糊、非标准字体、光晕、复杂背景等。我们的实验基准测试了领先的 OCR 算法,并在 RnD 上展示了仅有 0.527 的端到端 F1 分数,即使在微调后也是如此。对于不同遮挡类型的性能分析显示泥浆是主要挑战,与正常条件相比,这会严重降低准确性。但模型在其他因素包括光晕、模糊、阴影和灰尘方面表现困难。分析揭示了改进的巨大空间,并突显了现有模型的失败案例。RnD 是推动在非受限自然环境中鲁棒地识别文本这一开放问题上取得创新的有价值的新基准。作者希望社区能够基于这个数据集和基准实验来取得进展。该数据集可在此链接中获取:https:// 此处链接