Nov, 2024

降低大语言模型中对酷儿表现的偏见:一种协作代理的方法

TL;DR本研究解决了大语言模型输出中代词使用偏见的问题,尤其是针对酷儿个体的不当性别代词使用。我们提出了一种协作代理管道,通过分析和优化代词使用来提高包容性,实验结果显示该方法在包容性代词分类上显著优于GPT-4o,表明代理驱动框架在减少偏见和促进社会责任AI方面的潜力。