Jan, 2024

UniVIE:一种基于统一标签空间的表单式文档图像信息提取方法

TL;DR现有的视觉信息提取方法通常将从表单样式文档中提取信息的过程分解为不同的子任务,我们提出了一种新的视角,将其重新定义为关系预测问题,并统一了不同任务的标签,以解决表单文档中的层次关系。我们提出的统一模型 UniVIE 通过构建树提案和关系解码模块来全面解决视觉信息提取问题,通过引入树注意力掩码和树级别嵌入来增强关系预测能力。在我们的数据集 HierForms 和公开数据集 SIBR 上进行的广泛实验评估证明了我们方法达到了最先进的结果,突显了我们统一方法在推进视觉信息提取领域的有效性和潜力。