公平的分层聚类

Jun, 2020

Fair Hierarchical Clustering

Sara Ahmadian, Alessandro Epasto, Marina Knittel, Ravi Kumar, Mohammad Mahdian...

TL;DR本文研究在传统的分类中引入公正性准则，探索公平的分层聚类算法以解决机器学习系统中的过度表达问题。我们为多种自然目标提供了简单高效的算法，能够找到一个合理的公正的分层聚类，同时只会带来微不足道的目标损失。

Abstract

As machine learning has become more prevalent, researchers have begun to recognize the necessity of ensuring machine learning systems are fair. Recently, there has been an interest in defining a notion of

machine learning fairness hierarchical clustering algorithm objectives

发现论文，激发创造

通过层级公平 - 狄利克雷过程实现公平聚类

本文提出了一种基于模型的公平聚类方法，补充了现有大多数基于适当目标函数优化的文献，致力于解决机器学习带来的算法公平性问题。

May, 2023

基于层次凝聚聚类的公平算法

本文提出一种对分层聚类算法 (HAC) 进行公平性约束的方法，适用于任何自然的聚类公平措施和多个受保护群体，并在多个真实世界 UCI 数据集上进行了广泛的实验。

May, 2020

公平的多项式对数逼近低成本层次聚类

公平机器学习领域的关键问题是公平聚类算法的研究，特别是在现代智能系统引发了许多伦理争议的情况下。Ahmadian 等人提出了针对分层聚类的公平性研究，但他们的算法是高度理论化的。Knittel 等人提出了第一个实际的成本公平近似算法，但未能突破他们提出的多项式逼近的障碍。我们通过提出第一个真正的对数多项式逼近低成本公平分层聚类算法，极大地弥合了最好的公平聚类和普通聚类逼近之间的差距。

Nov, 2023

公平标注聚类

本文主要考虑聚类算法在实际应用中保证群体公平性的问题，并提出了相应的算法。在该算法中，决策者运行聚类算法，检查每个簇的中心并为其相应的簇分配一个适当的结果。

May, 2022

公平聚类：评析、注意事项和未来方向

公平聚类是机器学习和运筹学中的一个基本问题，然而，在算法设计中考虑公平性已变得极其重要，因此公平聚类已经受到研究界的广泛关注。本文对公平聚类进行了批判性的审视，发现了一些被忽视的问题，例如缺乏明确的效用描述和在机器学习环境中考虑公平聚类算法的下游影响的困难。我们还展示了一些情况，在这些情况下，应用公平聚类算法可能对社会福利产生重大负面影响。最后，我们提出了一些旨在推动公平聚类领域更有影响力研究的步骤。

Jun, 2024

公平聚类：因果视角

聚类算法可能无意中传播或加剧现有的不平等，导致不公正的表示或有偏见的决策。本文提出了一种聚类方法，该方法结合因果公平度量，以在无监督学习中提供更细致入微的公平方式。我们的方法使得可以指定应该最小化的因果公平度量，并使用已知具有不公平偏差的数据集证明了我们方法的功效。

Dec, 2023

公平的聚类算法

本文研究如何在数据中找到低成本的公平聚类问题，针对数据点可能属于多个受保护群体的情况，通过允许用户指定定义公平表示的参数、在任何 Lp 范数目标上工作的聚类算法以及允许个体属于多个保护群体的算法，将任何普通聚类解转换为公平聚类解，实验表明，在实践中算法的表现比理论结果更好。

Jan, 2019

比例代表聚类

在机器学习中，我们提出了一个新的公理，即比例表示公平（PRF），并设计了高效的算法来实现公平聚类，这一概念以一种更有说服力的方式实现了现有概念的存在原因。

Apr, 2023

概率公平聚类

本文针对聚类问题，研究了在不完全了解群组成员的情况下的公平性聚类问题，并提出了一种基于概率分配的聚类算法，可保证近似度。同时还探讨了一些基于距离和顺序的群组成员问题。通过实验验证了该方法的有效性。

Jun, 2020

比例公平聚类

本论文在度量空间中探讨了公平机器学习领域中比例质心聚类问题，定义了公平性并提出了计算、优化和审计聚类方案的算法，分析了比例方案与 K-Means 指标之间的权衡关系。

May, 2019