Dec, 2022

通过手动注释提高问答性能:成本、效益和策略

TL;DR本文介绍并公开发布了 PolQA,这是第一个用于 OpenQA 的波兰语数据集。该数据集包含 7,000 个问题,87,525 个手动标注的证据段落和超过 7,097,322 个候选段落。该资源允许我们评估不同注释选择对 QA 系统性能的影响,并提出一种有效的注释策略,使召回率提高了 10.55 p.p. 并同时将注释成本降低了 82%。