Jan, 2024

PEneo: 将线提取、线分组和实体链接统一为端到端文档对提取

TL;DRPEneo 是一种新的文档对提取框架,通过线提取、线分组和实体链接三个并发子任务来解决语义实体识别和关系抽取的错误积累问题和多行实体情况,与 LiLT 和 LayoutLMv3 等网络结构相结合在各种基准测试中表现出良好的性能,提升大幅度(例如,在 RFUND-EN 上的 F1 得分提高了 19.89%-22.91%),效果显著且具有广泛适用性。