Oct, 2024

从效率到公平:偏好学习中的公平性测量

TL;DR本研究针对当前偏好学习模型在公平性方面的不足,提出了一种评估其认知公平性的新框架,借鉴了经济不平等和罗尔斯公正理论。研究发现模型在用户表现上的差异,凸显潜在的认知不公,并探索了缓解这些不平等的处理技术,对AI伦理的发展具有重要贡献。