EMNLPSep, 2018

Chargrid: 了解二维文档

TL;DR本文介绍一种新颖的文本表示方法,该方法保留文档的 2D 布局,通过将每个文档页面编码为字符的二维网格来实现。基于此表示,我们提出了一个结构化文档的通用文档理解流程。该流程利用完全卷积编码器 - 解码器网络预测分割掩模和边界框。我们在发票信息提取任务上展示了其功效,并展示它在超过基于顺序文本或文档图像的方法中的显着表现优势。