Jun, 2024

MBBQ: 一份为生成式语言模型的跨语言比较刻板印象而设的数据集

TL;DR研究表明,生成性大型语言模型存在有害的偏见和刻板印象。该论文通过研究不同语言的社会刻板印象,控制文化差异和任务准确性,证实了非英语语言存在更多的偏见,并且观察到跨语言的偏见行为存在显著差异。