May, 2024

KVP10k: 商业文件中键值对提取的全面数据集

TL;DR最近几年来,从商业文件中提取信息的挑战已成为一项关键任务,在许多领域找到了应用。本文引起了工业界和学术界的广泛兴趣,突显了其在当前技术环境中的重要性。与大多数现有数据集和基准不同,我们的重点是在没有预先定义的键的情况下发现键值对,通过导航复杂模板和布局的数组来提取信息。为了弥补这一差距,我们介绍了 KVP10k,一个专门设计用于 KVP 提取的新数据集和基准。该数据集包含 10707 个丰富注释的图像。在我们的基准中,我们还引入了一个新的具有 KIE 和 KVP 元素的具有挑战性的任务。KVP10k 以其广泛的数据多样性和详细的注释而独树一帜,为从复杂商业文件中提取信息的领域的进展铺平了道路。