Aug, 2024

揭示职业偏见:使用美国劳动数据的基础去偏见方法

TL;DR本研究针对大型语言模型(LLMs)在性别、职业等敏感类别上固有的社会偏见问题,探讨了其与美国国家劳动统计局(NBLS)数据的关联。我们提出了一种简单有效的去偏见机制,通过直接利用NBLS实例来减轻LLMs中的偏见,并在七种不同的LLMs上进行实证研究,结果显示去偏见方法显著降低了偏见评分,促进了模型的公平性和可靠性。