本研究介绍了多臂赌博问题中的公平性概念以及提出了基于 “chained” 置信区间的多臂赌博问题的可证公平算法,并证明了任何公平算法必须具有该算法的时间复杂度,同时也证明了公平和非公平学习之间有强烈的界限。在一般情境中,本研究证明了公平性与 KWIK 学习模型的紧密联系,并提出了一种多项式时间复杂度的可证公平算法来解决线性上下文赌博问题。
May, 2016
本文研究线性 bandit 问题中的公平性,提出 meritocratic 公平的概念,并在更广泛的问题上进行分析,得出更好的性能保证。同时,探讨了无限线性 bandit 问题中的公平性问题,证明了实例相关性是必要的。结果是一个在线线性环境中 meritocratic 公平的框架,比现有技术的研究更强大、更普遍和更现实。
Oct, 2016
深入研究了公平性,提出了一种基于两个层次的公平性方法,保证每个组的最小曝光,并确保组内每个单元根据其优越性被拉动;通过提出的算法 BF-UCB,实现了对遗憾的上界为 O (√T) 的平衡,同时提供更好的组和个体曝光保证,并且不会显著降低奖励。
Feb, 2024
本研究介绍一种带有公平性约束条件的多臂赌博算法,使用关于用户和任务的上下文信息进行决策制定,以展示公平的决策结果
Dec, 2019
研究公平多臂老虎机问题中学习与公平之间的相互作用,通过特定向量表示公平性约束,定义一个公平感知的后悔,通过两个参数刻画一个 Fair-SMAB 算法类,并提供一个公平保证,无论学习算法的选择是什么,都可以持续地适用。
May, 2019
本研究提出了一种算法框架,使得在通过类似赌博机学习用户喜好进行内容个性化推荐过程中能够控制偏差和歧视,并通过实验验证了该算法的可行性和效果。
Feb, 2018
设计了一种高效算法,确保在全信息和强盗反馈设置中几乎达到次线性的遗憾,以解决 alpha-fair contextual bandits 问题。
Oct, 2023
本文针对基于多臂赌博机算法的在线推荐模型中的信息暴露偏差问题进行研究,分析了这些算法处理信息暴露偏差问题和提供公正的推荐结果的能力,并提出了一个折扣因子并将其纳入这些算法中,以控制每个时间步骤中商品的曝光率。在两个数据集上进行实验,并展示了该算法改善商品推荐可公正性的有效性。
Aug, 2021
研究推荐系统中的曝光公平性,提出了一种从消费者和生产者双方角度建模的公平度量,以缓解除了个体用户和物品的不公平之外的更系统性的偏见,进一步研究了曝光公平性维度之间的关系并演示了如何将随机排序策略优化为这些公平目标。
Apr, 2022
在联邦环境中,考虑具有公平性和隐私保证的上下文多臂赌博机问题。我们提出了一种新的通信协议,使得联邦学习更加有效,并提供了确保差分隐私的算法。我们通过广泛的模拟实验证明了我们提出算法的有效性。