未知公平性度量的在线学习

Feb, 2018

Online Learning with an Unknown Fairness Metric

Stephen Gillen, Christopher Jung, Michael Kearns, Aaron Roth

TL;DR该研究旨在解决在线学习在线性情境赌博机中存在强烈的个体公平约束的问题，其中个体公平性受未知相似性度量的支配，主要考虑通过算法减小公平性侵犯并达到最佳回报。

Abstract

We consider the problem of online learning in the linear contextual bandits setting, but in which there are also strong individual fairness

online learning linear contextual bandits individual fairness similarity metric regret bound

发现论文，激发创造

单调个体公平性

在线学习与个体公平性问题的方法，考虑了能够聚合任意数量审核员反馈的审核方案，并提出了两个算法分别用于降低后悔度和公平违规数量，在计算效率方面也做出了显著改进。

Mar, 2024

度量学习用于个体公平性

提出了一种基于人类判断的 “个体公正” 近似度量的解决方案，该模型假定我们可以获得人类的公正裁决者，其可以回答关于特定任务的个体相似性的有限一组查询，该模型包括相关的度量逼近定义，逼近构造和学习程序。

Jun, 2019

无限和上下文赌博机的公平算法

本文研究线性 bandit 问题中的公平性，提出 meritocratic 公平的概念，并在更广泛的问题上进行分析，得出更好的性能保证。同时，探讨了无限线性 bandit 问题中的公平性问题，证明了实例相关性是必要的。结果是一个在线线性环境中 meritocratic 公平的框架，比现有技术的研究更强大、更普遍和更现实。

Oct, 2016

汇集式赌博机中的校准公正

本研究探讨在随机的多臂老虎机决策框架下的公平性问题，采用 “相似个体应受到相似对待” 的公平性框架，使用平滑度约束和公平性遗憾度量实现公平性，研究表明 Thompson sampling 等算法可以实现平滑公平性，且在公平性遗憾上有 $ ilde {O}((kT)^{2/3})$ 的上界。

Jul, 2017

在在线分配中平衡价格与数据质量以实现公平

本文探讨了在不观察个体保护属性的情况下，使用不同质量的数据源估算这些属性以降低公平惩罚的在线分配问题，并提出了一种在多臂赌博问题的框架下同时解决两个问题的算法，该算法可以适应多种不同的公平概念，并且在一些情况下可以学习使用的估计值。

Jun, 2023

限制计算意识的公平性

在 Dwork 等人的框架中，我们研究了公平分类问题，提出了一种新的公平概念 (metric multifairness)。该概念是基于相似度度量和样本的比较集合，并且可以用有限次查询任意度量的方式来实现。

Mar, 2018

几乎度量一致的公平学习

研究介绍了关于个体公平性度量的概念，发现这种方法并不适用于机器学习的训练集以及潜在的人群，所以提出了一种相对放宽的类似度公平近似指标方法，同时实现了最佳的准确率作为 PACF 学习的基础。

Mar, 2018

适应性公平感知在线元学习在变化环境下的应用

本文提出了一种针对不断变化的环境的公平在线学习框架 FairSAOML，通过添加长期公平性约束来构建新的遗憾度量 FairSAR 和新的自适应公平在线元学习算法，提高分布不一样时的性能，同时对累积公平性约束和损失遗憾度提供了亚线性的理论上限，实验结果表明本文提出的算法在不同的数据集和环境中均优于当前最佳的在线学习算法。

May, 2022

强盗之中的荣誉：面向在线公平分配的无遗憾学习

通过探索 - 执行算法设计实现在线公平分配研究，解决基于多臂赌博携带公平约束的未知价值非可分配商品的社会福利最大化问题.

Jul, 2024

上下文匹配赌博机环境下的在线决策统计推断

这篇论文研究在线决策问题，通过采用上下文乐队 it，并建立奖励模型来进行长期奖励最大化。使用估计模型参数的 OLS 和 WLS 方法来处理该问题，借助中心极限定理证明了参数的渐近正常性。同时，我们还通过实验验证了我们的结论。

Oct, 2020