无过度表示的聚类

KDDMay, 2019

Clustering without Over-Representation

Sara Ahmadian, Alessandro Epasto, Ravi Kumar, Mohammad Mahdian

TL;DR本文介绍了一种解决分簇问题的算法，在不允许颜色过于集中的情况下进行经典分簇，使用线性规划方法得到分数解并进行四舍五入，同时提供了特殊情况下经过简化的组合算法。实验表明该算法能够有效地解决分簇问题，避免了过度集中。

Abstract

In this paper we consider clustering problems in which each point is endowed with a color. The goal is to cluster the points to minimize the classical clustering cost but with the additional constraint that no co

clustering color-constrained linear program combinatorial algorithm over-representation

发现论文，激发创造

聚类与多样性

本文主要讨论聚类算法在数据发布中的应用，特别是隐私保护，作者提出了一种 2 近似算法来解决按照颜色进行分组聚类的问题并讨论了其优化和推广。

Apr, 2010

概率公平聚类

本文针对聚类问题，研究了在不完全了解群组成员的情况下的公平性聚类问题，并提出了一种基于概率分配的聚类算法，可保证近似度。同时还探讨了一些基于距离和顺序的群组成员问题。通过实验验证了该方法的有效性。

Jun, 2020

模糊彩色模型与颜色聚类问题的聚类算法

通过使用模糊颜色模型，本研究旨在解决任意颜色数据的高效聚类任务，提出了一个新的模糊聚类算法，并对颜色成员计算进行了解释和实现。

Jul, 2024

可扩展的公平聚类

本研究提出了一种实用的近似公平分解算法，几乎在线性时间内运行，可对结果聚类的平衡性进行更精细的控制。

Feb, 2019

公平的聚类算法

本文研究如何在数据中找到低成本的公平聚类问题，针对数据点可能属于多个受保护群体的情况，通过允许用户指定定义公平表示的参数、在任何 Lp 范数目标上工作的聚类算法以及允许个体属于多个保护群体的算法，将任何普通聚类解转换为公平聚类解，实验表明，在实践中算法的表现比理论结果更好。

Jan, 2019

公平标注聚类

本文主要考虑聚类算法在实际应用中保证群体公平性的问题，并提出了相应的算法。在该算法中，决策者运行聚类算法，检查每个簇的中心并为其相应的簇分配一个适当的结果。

May, 2022

论基本公平聚类的代价

本文提出了针对多个保护类的公平聚类方法，并且提出了一种松散的公平概念，在这种概念下，可以对所有经典聚类目标进行双标准常数因子近似，这是通过将任意现有不公平的（整数）解和公平的（分数）线性规划解结合起来实现的。

Nov, 2018

全色最短路径问题

该篇论文介绍了一种定义在无向图上的全色最短路径问题，它旨在寻找一条最短路径，在路径中每种颜色至少出现一次，假设图中的每个顶点都与一个已知的颜色相关联。该论文证明了这个问题是 NP-hard 的，并提出了用 LP 松弛，模拟退火，蚁群算法和遗传算法等多种启发式方法来解决该问题，并进行了广泛的模拟来进行比较分析。

Jul, 2015

修改公平集群编辑

对于给定的图形应用 NP-hard Cluster Editing 问题的标准算法可能会产生偏向于数据子组（例如人口群体）的解决方案，我们提出了一种修改公平性约束条件，以确保每个子组的修改次数与其大小成比例，模型在现实社交网络上的经验分析表明，修改公平性的代价惊人地低。

Dec, 2021

公平范围聚类的近似算法

研究公平间距聚类问题，提供 O (1) 的近似算法在最多 k+2l 个中心中选择最小化聚类成本的一组中心，并仅在每个人口统计上最多违反 2 个加法项的上限。

Jun, 2023