Jun, 2022

柔性文本生成用于反事实公平探究

TL;DR本文介绍了一种使用大型语言模型生成对抗样本的方法,该方法克服了现有方法的局限性,能够产生复杂的对抗样本,并在 Civil Comments 数据集上比较了各种方法的性能和价值,并展示了其在评估毒性分类器方面的价值。