ACLApr, 2024

大型语言模型的排名公平性实证研究

TL;DR该研究通过使用 TREC 公平排名数据集对大型语言模型(LLMs)进行了实证研究,重点关注性别和地理位置等二元受保护属性的表示,以揭示它们在排序算法中的偏见,从用户和内容角度评估公平性,为评估 LLMs 作为公平排序器提供了实证基准。