BriefGPT.xyz
大模型
Ask
alpha
关键词
line item recognition
搜索结果 - 2
DocILE 文件信息定位与提取基准测试
本文介绍了 DocILE 数据集及其应用,它包括 6.7K 个注释的商业文件、100K 个合成文件和近 1M 个未标记的文件,旨在为关键信息定位和提取以及行项目识别等任务提供基准,并提供了几个基线模型,包括 RoBERTa、LayoutLM
→
PDF
a year ago
商业文件信息提取:朝着实用基准的方向
本文研究信息提取的问题,探讨了文档信息提取问题、数据集、基准测试等方面,提出了机器学习中的关键信息定位、提取和条目识别问题,并批评了目前缺乏半结构化商务文档的相关数据集和基准测试。
PDF
2 years ago
Prev
Next