算法公平性的信息流视角
研究算法公平性和隐私在机器学习中的应用,分析了公平性对训练数据信息泄露的影响,发现公平性会牺牲一部分隐私权,特别是对弱势群体。同时,训练数据的偏差越大,为了弱势群体的公平性所付出的隐私成本也越高。
Nov, 2020
通过分析算法公平性的因果定义,本文发现无论是基于对抗偏见的决策影响还是基于法律保护分类的影响,这些定义几乎总是以极端帕累托支配的决策方案结束,这突显了因果公平性普遍数学概念的形式限制和潜在的不良后果。
Jul, 2022
介绍了一种框架,在该框架中,可以将成对的个体标识为需要(大约)相等的待遇。我们引入了一种算法,可以在满足预设的公平性约束条件下学习最准确的模型,并证明了其准确性和公平性的泛化界限。该算法还可以将传统的统计公平概念与 elicited constraints 相结合,从而通过前者 “纠正” 或修改后者。我们使用在 COMPAS 犯罪再犯率数据集上 elicited 的 human-subject 公平性约束条件的行为学研究报告了初步结果。
May, 2019
本文提出一个数学模型,旨在更准确地衡量算法公平性的不同机制,并介绍了构造空间的概念,同时指出为证明整个决策过程的优良特性,公平性需要不同的构建空间到决策空间的映射,在将来的算法公平性研究中,应更加明确构建和观测之间关系的假设。
Sep, 2016
本文探讨了基于因果关系的公平性概念及其在实际场景中的适用性,并针对采用观察数据估计因果量的不同方法,包括可辨识性和潜在结果框架进行了综合报告,提供出一个指南来帮助选择适合特定实际场景的公平性概念,并根据 Pearl 的因果推理难度对公平性概念进行了排名。
Oct, 2020
讨论如何使用因果贝叶斯网络和最优输运理论来处理机器学习公平性问题,尤其是在复杂的不公平场景下,提出了一种统一的框架来处理不同的情况和公平标准,并介绍了一种学习公平表示的方法和一种考虑敏感属性使用限制的技术。
Dec, 2020
研究提出了一个信息理论框架来设计公平的预测器,以在监督学习环境中防止对指定敏感属性的歧视。使用平等的机会作为歧视标准,这要求在实际标签的条件下,预测应独立于受保护属性。同时确保公平和泛化,将数据压缩到辅助变量,再通过贝叶斯决策规则得到最终预测器。
Jan, 2018
本篇文章提出了一种基于信息论度量和 Shapley 值函数的公平特征选择框架,以考虑特征与决策结果之间的相关性,量化了不同特征对决策结果准确性与公平性的影响,最终设计了一个特征的公平效用分数,对真实和合成数据进行了性能评估。
Jun, 2021