Jul, 2023

PPN:用于复杂布局的并行指针网络的关键信息提取

TL;DR提出了一个挑战性的多模态任务:关键信息提取 (Key Information Extraction),旨在从视觉丰富的文档中提取结构化的值语义实体。通过引入一种新的大规模人工标注数据集,名为复杂布局表单 (CLEX),该数据集包括 5,860 个图像和 1,162 个语义实体类别,以解决现有数据集布局相对固定且语义实体类别有限的问题。通过引入一种名为 Parallel Pointer-based Network (PPN) 的端到端模型,用于零样本和小样本场景,解决了现有方法在错误传播和未知语义实体类别问题上的困难。CLEX 数据集上的实验证明,PPN 在推理速度方面表现出色,并且优于现有的最先进方法。