AAAIJan, 2021

现实世界中稳健的视觉信息提取:新数据集和新方法

TL;DR本文提出了一种鲁棒的视觉信息提取系统(VIES),它是一个统一的端到端可训练框架,用于同时进行文本检测、识别和信息提取。同时,本文构建了一个名为 EPHOIE 的数据集,它是用于文本定位和视觉信息提取的第一个中文基准数据集。与最先进的方法相比,我们的系统在 EPHOIE 数据集上取得了显著的优异表现,在 SROIE 数据集的端到端情况下,F 分数提高了 9.01%。