Sep, 2024

角色设定陷阱:大语言模型中的持续外群偏见源于社会身份认同

TL;DR本研究解决了大语言模型(LLMs)在身份认同的内化过程中,对外群体偏见的忽视问题。通过社会身份理论,我们展示了外群体偏见与内群体偏见同样强烈,并通过引导语言模型采用被先前不利群体的视角,有效减轻了其固有的偏见。这一发现对开发更加公正平衡的语言模型具有重要意义。