文本生成中的国籍偏见

Feb, 2023

Nationality Bias in Text Generation

Pranav Narayanan Venkit, Sanjana Gautam, Ruchi Panchanadikar, Ting-Hao, Huang...

TL;DR这篇论文分析了语言模型中的国籍偏见，探讨了GPT-2生成的故事中如何突出现有的有关国籍的社会偏见，并使用敏感性分析探讨了互联网用户数量和国家经济状况对故事情绪的影响。同时还研究了对抗触发的去偏置方法，研究结果表明，GPT-2在对互联网用户较少的国家存在显著的偏见，而对抗触发方法可以有效地降低偏见。

Abstract

Little attention is placed on analyzing nationality bias in language models, especially when nationality is highly used as a factor in increasing the performance of social NLP models. This paper examines how a te