关键词stochastic ranking policies
搜索结果 - 2
- 受限元最优输运下的重排学习
本文提出了一种新的,快速,轻量级的用于预测公平随机重排序策略的方法:Constrained Meta-Optimal Transport (CoMOT) 及其在线采样方法 Gumbel-Matching Sampling (GumMS),通 - 排名公平性的政策学习
本文提出了一种利用随机排序策略来进行公平学习及考虑排序项影响的通用 LTR 框架,并通过基于政策梯度方法的 Fair-PG-Rank 算法进行优化,可在保持曝光公平性的情况下优化各种效用指标。通过实验结果验证了此方法在个人和集体公平性方面的