Aug, 2023

警惕欺骗:通过受控声明编辑检测半真相并揭穿其真相

TL;DR我们创建了一个包含半真实检测模型和声明编辑模型的综合流程,通过使用 T5 模型进行闭环控制的声明编辑来帮助解决互联网上半真实言论的问题。我们的方法在编辑后的声明上实现了平均 BLEU 得分为 0.88,并且 85% 的虚假揭穿得分。重要的是,相比于 GPT2、RoBERTa、PEGASUS 和 Tailor 等其他语言模型,我们基于 T5 的方法在虚假揭穿得分上平均提升了 82%、57%、42% 和 23%。通过扩展 LIAR PLUS 数据集,我们的半真实检测模型达到了 82% 的 F1 得分,创造了领域的新纪录。虽然以前有过半真实检测的尝试,但我们的方法是我们所知道的第一个试图揭穿半真实言论的。