Apr, 2021

Re-TACRED: 解决 TACRED 数据集的不足

TL;DR本文针对 TACRED 数据集进行了全面研究和改进,提出了改进的众包策略,通过重新注释整个数据集,发现 TACRED 标签中有 23.9% 是错误的,用改进后的数据集评估模型,平均 f1 得分提高了 14.3%,并揭示了不同模型之间的显著关系。最终,我们发布了 Re-TACRED,这是一个全新完全重新注释的 TACRED 数据集版本,可以用于可靠地评估关系提取模型。