通过非披露代理实现平衡过滤

Jun, 2023

Balanced Filtering via Non-Disclosive Proxies

Siqi Deng, Emily Diana, Michael Kearns, Aaron Roth

TL;DR本研究旨在解决群体成员身份不可用或不被允许使用时，非披露性地收集与敏感群体平衡的数据样本的问题，并通过采用公平性流程视角和使用少量标记数据训练代理函数来实现。

Abstract

We study the problem of non-disclosively collecting a sample of data that is balanced with respect to sensitive groups when group membership is unavailable or prohibited from use at collection time. Specifically, our collection mechanism does not reveal significantly more about

non-disclosive data collection fairness pipeline group membership proxy function generalization properties

发现论文，激发创造

代理公正性

本文研究在没有标记受保护组的数据集的情况下，通过改善代理组的公平度量来提高真实敏感组的公平度，并在基准和实际数据集上进行了实验。然而，该策略的有效性可能取决于公平度量的选择以及代理组在约束模型参数方面与真实受保护组的对齐程度。

Jun, 2018

通过生成代理敏感属性标签实现实际偏见缓解

通过提出的无监督代理敏感属性标签生成技术来解决在机器学习系统中的偏见问题，该方法包括无监督嵌入生成和聚类两个阶段，其有效性依赖于偏见通过与敏感属性相关的非敏感属性传播，并在高维潜在空间中映射为不同人口群体的聚类。实验结果表明，使用现有算法进行偏见缓解可以得到与真实敏感属性相比可比较的结果。

Dec, 2023

缺失敏感属性的公平性，使用弱代理足够且更好

本研究提出一种算法来利用仅有的三个适当识别出的虚拟属性来精确测量公平性和减轻偏见，并展示其允许仅使用虚弱代理来增加用户隐私。

Oct, 2022

数据驱动系统中的代理非歧视原则

该研究旨在解决机器学习算法在训练中自然而然会对历史上被歧视的群体产生偏差的问题，并通过实验证明了可以通过验证和修复违规来解决这些问题。

Jul, 2017

深度度量学习中的信息样本感知代理

本研究提出了一种名为 Informative Sample-Aware Proxy（Proxy-ISA）的基于代理（proxy）的深度度量学习方法，该方法使用一种定时的阈值函数直接修改每个样本的梯度权重因子，使模型更加敏感于信息样本，进而取得更优的检索精度表现。

Nov, 2022

差分隐私公平学习

研究如何在收集敏感属性信息受到禁止或限制的情况下，通过差分隐私算法实现公平学习，并提出两种算法来设计实现，同时保证了差分隐私和均等几率性，讨论这三个性质间的权衡关系。

Dec, 2018

公平分类的超参数调整，不需要敏感属性访问

该论文提出 Antigone 框架，通过使用基于偏见分类器所产生的伪敏感属性标签来训练公平分类器，无需使用敏感属性标签，通过同时最大化准确性和公平性来实现平等机器学习。

Feb, 2023

具有噪声保护组的公平鲁棒优化

研究机器学习的公平性标准，提出一种使用鲁棒优化的新方法来处理受保护群体的嘈杂标签问题，并经实验验证，该方法能更好地保证在真实受保护群体上的公平性标准。

Feb, 2020

群体无差别最优输运到群体平等及其约束变体

我们设计了一种单一的群体盲扫描映射，它使源数据中两个群体的特征分布对齐，从而实现了（人口）群体平等，而不需要在映射的计算和使用过程中提供个体样本的受保护属性的值，也不依赖受保护属性的可访问性或估计。

Oct, 2023

利用数据组合评估隐含保护类别的算法公正性

本文研究了评估算法决策的不平等影响面临的根本性挑战：保护类成员在数据中通常不可观察。研究者考虑使用附加数据集来构建模型，从而预测代理变量（如姓氏和地理位置）来确定受保护类别的成员身份，提供了计算和可视化这些集合的算法和统计工具。通过借助美国人口普查数据和两个真实案例（抵押贷款和个性化药物剂量），展示了这种方法可以实现可靠和稳健的不平等影响评估。

Jun, 2019