EMNLPAug, 2021

不予理睬:对话生成模型在攻击性场景中的立场分析

TL;DR通过对 Reddit 对话情景下的回应训练,研究对话模型响应中的攻击性语言,实验结果表明神经网络对话模型容易学习产生攻击性的回应,使用可控文本生成模型可以减少攻击性回复产生的数量。