Jun, 2022

自我中心数据OCR评估

TL;DR本文研究了现有的OCR方法在自我中心数据上的应用。我们针对 EPIC-KITCHENS 图像中的文本进行了注释,并证明现有的OCR方法难以应对旋转文本。我们介绍了一个简单的旋转和合并过程,可应用于预训练的OCR模型,并将规范化编辑距离误差减半。这表明未来的OCR尝试应将旋转纳入模型设计和培训过程中。