Jan, 2025
显性与隐性:通过自我反思调查大型语言模型中的社会偏见
Explicit vs. Implicit: Investigating Social Bias in Large Language
Models through Self-Reflection
TL;DR本文针对大型语言模型(LLMs)中显性和隐性偏见的研究空白,提出了一种基于社会心理学理论的系统框架。研究发现,LLMs在显性偏见和隐性偏见之间存在显著不一致,提高训练数据和模型规模能减轻显性偏见,但隐性偏见却呈上升趋势,显示出对现有方法需要新颖的应对策略。