未知公平性度量的在线学习
提出了一种基于人类判断的 “个体公正” 近似度量的解决方案,该模型假定我们可以获得人类的公正裁决者,其可以回答关于特定任务的个体相似性的有限一组查询,该模型包括相关的度量逼近定义,逼近构造和学习程序。
Jun, 2019
本文研究线性 bandit 问题中的公平性,提出 meritocratic 公平的概念,并在更广泛的问题上进行分析,得出更好的性能保证。同时,探讨了无限线性 bandit 问题中的公平性问题,证明了实例相关性是必要的。结果是一个在线线性环境中 meritocratic 公平的框架,比现有技术的研究更强大、更普遍和更现实。
Oct, 2016
本研究探讨在随机的多臂老虎机决策框架下的公平性问题,采用 “相似个体应受到相似对待” 的公平性框架,使用平滑度约束和公平性遗憾度量实现公平性,研究表明 Thompson sampling 等算法可以实现平滑公平性,且在公平性遗憾上有 $ ilde {O}((kT)^{2/3})$ 的上界。
Jul, 2017
本文探讨了在不观察个体保护属性的情况下,使用不同质量的数据源估算这些属性以降低公平惩罚的在线分配问题,并提出了一种在多臂赌博问题的框架下同时解决两个问题的算法,该算法可以适应多种不同的公平概念,并且在一些情况下可以学习使用的估计值。
Jun, 2023
在 Dwork 等人的框架中,我们研究了公平分类问题,提出了一种新的公平概念 (metric multifairness)。该概念是基于相似度度量和样本的比较集合,并且可以用有限次查询任意度量的方式来实现。
Mar, 2018
研究介绍了关于个体公平性度量的概念,发现这种方法并不适用于机器学习的训练集以及潜在的人群,所以提出了一种相对放宽的类似度公平近似指标方法,同时实现了最佳的准确率作为 PACF 学习的基础。
Mar, 2018
本文提出了一种针对不断变化的环境的公平在线学习框架 FairSAOML,通过添加长期公平性约束来构建新的遗憾度量 FairSAR 和新的自适应公平在线元学习算法,提高分布不一样时的性能,同时对累积公平性约束和损失遗憾度提供了亚线性的理论上限,实验结果表明本文提出的算法在不同的数据集和环境中均优于当前最佳的在线学习算法。
May, 2022
这篇论文研究在线决策问题,通过采用上下文乐队 it,并建立奖励模型来进行长期奖励最大化。 使用估计模型参数的 OLS 和 WLS 方法来处理该问题,借助中心极限定理证明了参数的渐近正常性。同时,我们还通过实验验证了我们的结论。
Oct, 2020