EMNLPJul, 2021

Form2Seq:高阶表单结构提取框架

TL;DR提出一种基于文本的新颖结构提取框架 Form2Seq,将文档结构提取任务转化为两个子任务:低级元素分类和高级构建分组,通过顺序预测每个元素实现结构提取,使用两个任务级联深度学习训练提高了结果准确性,在 ICDAR 2013 数据集上实现了最佳效果。