Jan, 2024

群体地位对LLM生成文本中群体表现的可变性的影响

TL;DR大型语言模型经常用于日常生活,但其内部机制仍然不透明。本文将研究LLMs中存在的偏见,特别是与社会群体的刻板属性相关的偏见,并扩展研究范围,探究LLMs中的另一种偏见,即社会优势群体相对于社会从属群体更具异质性的现象。本研究使用ChatGPT,一个最先进的LLM,生成了关于交叉群体身份的多样化文本,并比较了文本的同质性。我们一致发现,LLMs将非洲裔、亚洲裔和拉美裔美国人描绘为比白人更具同质性。他们还描绘女性比男性更具同质性,但这些差异很小。最后,我们发现性别的影响在种族/民族群体中存在差异,即在非洲裔和拉美裔美国人中性别的影响是一致的,但在亚洲裔和白人中不一致。我们对LLMs中这种偏见的可能来源进行了推测,并指出这种偏见有可能放大未来LLM训练中的偏见并强化刻板印象。