Jun, 2022
商业文件信息提取:朝着实用基准的方向
Business Document Information Extraction: Towards Practical Benchmarks
Matyáš Skalický, Štěpán Šimsa, Michal Uřičář, Milan Šulc
TL;DR本文研究信息提取的问题,探讨了文档信息提取问题、数据集、基准测试等方面,提出了机器学习中的关键信息定位、提取和条目识别问题,并批评了目前缺乏半结构化商务文档的相关数据集和基准测试。