EMNLPSep, 2020

评估语言模型中神经毒性退化的 RealToxicityPrompts

TL;DR该研究通过创建 RealToxicityPrompts 数据集,使用多种文本生成方法实验了预训练神经语言模型生成有毒文本的能力,指出有效的数据选择过程是避免预训练神经语言模型生成有毒内容的必要步骤。