EMNLPOct, 2022

ERNIE-Layout:基于排版知识增强的视觉化文档理解预训练

TL;DR提出了 ERINIE-Layout,一种新颖的以布局知识增强的文档预训练解决方案,通过整个工作流程来学习将文本、布局和图像特征结合起来的更好表现,以及如何在文档中学习适当的阅读顺序。实验结果表明,ERNIE-Layout 在各种下游任务上取得了卓越的性能,成为关键信息提取、文档图像分类和文档问答数据集的新的最先进技术,且代码和模型公开。