Nov, 2019

公平且无偏的排名函数的策略梯度训练

TL;DR本文提出了一种能够同时解决学习算法固有的和训练数据中的算法和应用中置入偏见的公平性问题的排序方法,采用一类延迟策略梯度方法,即采用公平度量的代价函数,并针对所需的应用程序选择一类的 “平均公平度量” 选择公平度量,有效地使学习算法能够处理包含偏差和噪声的数据,并通过对算法进行实证研究证明其能够获得准确而公平的排序策略。