ICMLOct, 2022

KPI-EDGAR:一个新型财务文档关系抽取数据集及其度量标准

TL;DRKPI-EDGAR 是一个基于文件上传到 EDGAR 系统的财务报告的联合命名实体识别和关系提取的数据集,该数据集的主要目标是从财务文件中提取关键绩效指标,并将它们链接到他们的数值和其他属性。我们还提供了四个附带的基准测试,用于衡量未来潜在的研究成果。此外,我们提出了一种新的成功度量方式,通过将单词级加权方案纳入传统的 F1 分数来更好地模拟该领域实体对的本质模糊边界。