ACLJun, 2023
WinoQueer:针对大型语言模型中反 LGBTQ + 偏见的社区参与基准测试
WinoQueer: A Community-in-the-Loop Benchmark for Anti-LGBTQ+ Bias in Large Language Models
Virginia K. Felkner, Ho-Chun Herbert Chang, Eugene Jang, Jonathan May
TL;DRWinoQueer 是一个针对衡量大型语言模型是否存在有害 LGBTQ + 社区的偏见的基准,该论文通过社区调查来确定偏见审核基准。基准测试了多个热门 LLM 模型,发现开箱即用的模型通常存在相当大的反同偏见。最后,我们展示了 LLM 对边缘化社区的偏见可以通过微调社区成员编写的数据来得到缓解,而社交媒体文本比非成员编写的新闻文本更有效。