Feb, 2024

在显式无偏的大型语言模型中测量隐性偏见

TL;DR通过心理学启发的 LLM 暗示联想测试偏差和 LLM 决策偏差等两项偏差测量方法,揭示了大规模语言模型中普遍存在的人类化刻板印象偏差,以及对决策任务中的微妙歧视进行检测。