May, 2022

预训练语言模型作为重新注释工具

TL;DR本文讲述了如何利用预训练语言模型降噪数据集,提出了两种任务:注释不一致检测和注释错误更正。作者使用新的可信度分数来检测不一致性,并用两种方法来更正注释。此外,通过重新注释创建了一个新数据集 Re-DocRED,自动降噪训练集将对关系抽取模型产生多达 3.6%的性能提高。