ACLJun, 2024

为什么基于提示的公平度量不相关?

TL;DR该研究针对大型语言模型可能学习到的偏见,通过评估和减轻这些偏见的多个指标发现,基于提示的公平性指标间的相关性较低,因此提出了一种名为 CAIRO 的方法,通过增强提示信息来提高公平性指标之间的相关性,并取得了显著的改善。