ACLJan, 2021

探索文本生成中阴谋论记忆化的现象

TL;DR研究表明,预训练的生成语言模型很容易会生成蕴含阴谋论的文本,指出在发布自然语言生成应用之前需要进行彻底的审核,并深入探讨生成语言模型中记忆的缺陷。