本文主要讨论聚类算法在数据发布中的应用,特别是隐私保护,作者提出了一种 2 近似算法来解决按照颜色进行分组聚类的问题并讨论了其优化和推广。
Apr, 2010
本文针对聚类问题,研究了在不完全了解群组成员的情况下的公平性聚类问题,并提出了一种基于概率分配的聚类算法,可保证近似度。同时还探讨了一些基于距离和顺序的群组成员问题。通过实验验证了该方法的有效性。
Jun, 2020
通过使用模糊颜色模型,本研究旨在解决任意颜色数据的高效聚类任务,提出了一个新的模糊聚类算法,并对颜色成员计算进行了解释和实现。
Jul, 2024
本研究提出了一种实用的近似公平分解算法,几乎在线性时间内运行,可对结果聚类的平衡性进行更精细的控制。
Feb, 2019
本文研究如何在数据中找到低成本的公平聚类问题,针对数据点可能属于多个受保护群体的情况,通过允许用户指定定义公平表示的参数、在任何 Lp 范数目标上工作的聚类算法以及允许个体属于多个保护群体的算法,将任何普通聚类解转换为公平聚类解,实验表明,在实践中算法的表现比理论结果更好。
Jan, 2019
本文主要考虑聚类算法在实际应用中保证群体公平性的问题,并提出了相应的算法。在该算法中,决策者运行聚类算法,检查每个簇的中心并为其相应的簇分配一个适当的结果。
May, 2022
本文提出了针对多个保护类的公平聚类方法,并且提出了一种松散的公平概念,在这种概念下,可以对所有经典聚类目标进行双标准常数因子近似,这是通过将任意现有不公平的(整数)解和公平的(分数)线性规划解结合起来实现的。
Nov, 2018
该篇论文介绍了一种定义在无向图上的全色最短路径问题,它旨在寻找一条最短路径,在路径中每种颜色至少出现一次,假设图中的每个顶点都与一个已知的颜色相关联。该论文证明了这个问题是 NP-hard 的,并提出了用 LP 松弛,模拟退火,蚁群算法和遗传算法等多种启发式方法来解决该问题,并进行了广泛的模拟来进行比较分析。
Jul, 2015
对于给定的图形应用 NP-hard Cluster Editing 问题的标准算法可能会产生偏向于数据子组(例如人口群体)的解决方案,我们提出了一种修改公平性约束条件,以确保每个子组的修改次数与其大小成比例,模型在现实社交网络上的经验分析表明,修改公平性的代价惊人地低。
Dec, 2021
研究公平间距聚类问题,提供 O (1) 的近似算法在最多 k+2l 个中心中选择最小化聚类成本的一组中心,并仅在每个人口统计上最多违反 2 个加法项的上限。
Jun, 2023