公平的分层聚类
本文提出一种对分层聚类算法 (HAC) 进行公平性约束的方法,适用于任何自然的聚类公平措施和多个受保护群体,并在多个真实世界 UCI 数据集上进行了广泛的实验。
May, 2020
公平机器学习领域的关键问题是公平聚类算法的研究,特别是在现代智能系统引发了许多伦理争议的情况下。Ahmadian 等人提出了针对分层聚类的公平性研究,但他们的算法是高度理论化的。Knittel 等人提出了第一个实际的成本公平近似算法,但未能突破他们提出的多项式逼近的障碍。我们通过提出第一个真正的对数多项式逼近低成本公平分层聚类算法,极大地弥合了最好的公平聚类和普通聚类逼近之间的差距。
Nov, 2023
公平聚类是机器学习和运筹学中的一个基本问题,然而,在算法设计中考虑公平性已变得极其重要,因此公平聚类已经受到研究界的广泛关注。本文对公平聚类进行了批判性的审视,发现了一些被忽视的问题,例如缺乏明确的效用描述和在机器学习环境中考虑公平聚类算法的下游影响的困难。我们还展示了一些情况,在这些情况下,应用公平聚类算法可能对社会福利产生重大负面影响。最后,我们提出了一些旨在推动公平聚类领域更有影响力研究的步骤。
Jun, 2024
聚类算法可能无意中传播或加剧现有的不平等,导致不公正的表示或有偏见的决策。本文提出了一种聚类方法,该方法结合因果公平度量,以在无监督学习中提供更细致入微的公平方式。我们的方法使得可以指定应该最小化的因果公平度量,并使用已知具有不公平偏差的数据集证明了我们方法的功效。
Dec, 2023
本文研究如何在数据中找到低成本的公平聚类问题,针对数据点可能属于多个受保护群体的情况,通过允许用户指定定义公平表示的参数、在任何 Lp 范数目标上工作的聚类算法以及允许个体属于多个保护群体的算法,将任何普通聚类解转换为公平聚类解,实验表明,在实践中算法的表现比理论结果更好。
Jan, 2019
本文针对聚类问题,研究了在不完全了解群组成员的情况下的公平性聚类问题,并提出了一种基于概率分配的聚类算法,可保证近似度。同时还探讨了一些基于距离和顺序的群组成员问题。通过实验验证了该方法的有效性。
Jun, 2020