Mar, 2021

基于空间双模态图推理的关键信息提取

TL;DR本文提出了一种旨在从文档图片中提取关键信息的端到端空间双模图形推理方法,将文档图像建模为双模图,节点编码检测到的文本区域的视觉和文本特征,边表示相邻文本区域的空间关系,并通过沿图边传播消息和推理图节点的类别来解决关键信息提取问题;进一步提供了一个新的数据集 “WildReceipt”,其中包含 25 个关键信息类别,约 69000 个文本框,并在 SROIE 和 WildReceipt 上获得了最新的最佳结果。