Mar, 2024

生成语言模型的非歧视标准

TL;DR研究如何发现和量化生成语言模型中的性别偏见,并设计了针对职业性别刻板印象的标准,通过职业性别刻板印象的测试结果论证了这些标准在生成人工智能模型中的存在。