Jun, 2024

SRFUND:形态理解中的多粒度分层结构重建基准

TL;DR我们提出了 SRFUND,这是一个层次结构化的多任务表单理解基准数据集,它在原始的 FUNSD 和 XFUND 数据集基础上提供了细化的注释,涵盖了五个任务:(1)将单词合并为文本行,(2)将文本行合并为实体,(3)实体分类,(4)项目表定位,以及(5)基于实体的完整文档层次结构恢复。