Feb, 2023

文本生成中的国籍偏见

TL;DR这篇论文分析了语言模型中的国籍偏见,探讨了GPT-2生成的故事中如何突出现有的有关国籍的社会偏见,并使用敏感性分析探讨了互联网用户数量和国家经济状况对故事情绪的影响。同时还研究了对抗触发的去偏置方法,研究结果表明,GPT-2在对互联网用户较少的国家存在显著的偏见,而对抗触发方法可以有效地降低偏见。