聚类中的分布式个体公平性
提出了一种基于人类判断的 “个体公正” 近似度量的解决方案,该模型假定我们可以获得人类的公正裁决者,其可以回答关于特定任务的个体相似性的有限一组查询,该模型包括相关的度量逼近定义,逼近构造和学习程序。
Jun, 2019
本文探讨了公平聚类中两种最广泛的人口统计学表示公平概念,并表明了通过近似算法可实现同时满足两个约束条件的恒定近似解。此外,GF 和 DS 与其他基于距离的公平概念不兼容,并进行实验以验证理论发现。
May, 2023
本文研究如何在数据中找到低成本的公平聚类问题,针对数据点可能属于多个受保护群体的情况,通过允许用户指定定义公平表示的参数、在任何 Lp 范数目标上工作的聚类算法以及允许个体属于多个保护群体的算法,将任何普通聚类解转换为公平聚类解,实验表明,在实践中算法的表现比理论结果更好。
Jan, 2019
本文提出了一种基于概率映射用户记录的方法,用于实现算法决策应用的个体公平性和真实应用环境下的分类器和排名等工具的效用性,并通过应用于现实世界数据集的分类和学习排序任务的实验表明了其比之前最佳方法有显著改善。
Jun, 2018
本文提出不需要人工规范距离度量的个体公平性的实现方法。我们提出新的方法获取和利用关于同样值得的个人的附加信息来打破社会群体之间的剥夺,将这些知识建模为公平图,并学习数据的统一成对公平表示,捕捉个体间数据驱动的相似性和公平性图中成对附加信息。我们从各种来源获取公平判断,包括关于再犯率预测(COMPAS)和暴力社区预测(Crime&Communities)的两个真实数据集的人类判断。实验显示,对于实现个体公平,PFR 模型是实际可行的。
Jul, 2019
本文提出了一种基于局部搜索的算法,用于实现 $k$-median 和 $k$-means(以及任何使用 $\ell_p$ 范数的 $k$- 聚类),并从个体公平性的角度来考虑。我们的算法提供了一个逼近可行的 $k$- 聚类,其 $k$-median ($k$-means) 的成本与最优的 $k$- 聚类成本相比呈常数比例,并且我们的解决方案大约满足公平条件 (也在常数因子之内)。此外,我们还通过实证评估来补充我们的理论界限。
Feb, 2020
在 Dwork 等人的框架中,我们研究了公平分类问题,提出了一种新的公平概念 (metric multifairness)。该概念是基于相似度度量和样本的比较集合,并且可以用有限次查询任意度量的方式来实现。
Mar, 2018
我们研究了最优统计公平性解决方案与个别公平性之间的兼容性,并分析了它们之间的冲突以及潜在解决方案。通过放宽前者到 Pareto 边界,我们确定了满足个体公平性要求的 Pareto 边界区域,从而使统计公平的 Pareto 最优性与个体公平性的约束相适应。
Jan, 2024