ACLJun, 2023

WinoQueer:针对大型语言模型中反 LGBTQ + 偏见的社区参与基准测试

TL;DRWinoQueer 是一个针对衡量大型语言模型是否存在有害 LGBTQ + 社区的偏见的基准,该论文通过社区调查来确定偏见审核基准。基准测试了多个热门 LLM 模型,发现开箱即用的模型通常存在相当大的反同偏见。最后,我们展示了 LLM 对边缘化社区的偏见可以通过微调社区成员编写的数据来得到缓解,而社交媒体文本比非成员编写的新闻文本更有效。