基于不确定数据的不确定质心分区聚类

Mar, 2012

基于不确定数据的不确定质心分区聚类

Uncertain Centroid based Partitional Clustering of Uncertain Data

Francesco Gullo, Andrea Tagarelli

TL;DR本文基于一种新颖的聚类中心点概念，理论研究了现有的分区聚类方法，并提出了一种有基础的聚类方法，以便更好的表达一组不确定对象的聚类，从而支持更一致的改进聚类性能，同时保持着与现有分区聚类算法相近的效率。

Abstract

clustering uncertain data has emerged as a challenging task in uncertain data management and mining. Thanks to a computational complexity

clustering uncertain data partitional clustering cluster centroid clustering objective function

发现论文，激发创造

无需地面真值的图像聚类

该论文介绍了一种基于众包模型的图像聚类方法，可应对无法得知聚类数目的情况，该方法的有效性已通过在多个人工数据集上的应用得到了证明。

Oct, 2016

聚类的计算理论与半监督算法

提出了一种计算理论和半监督聚类算法，将聚类定义为根据所选的聚类原则和度量方法获得数据分组，使每个组不包含异常值，所有其他示例被认为是边缘点，孤立的异常值、异常簇或未知簇。

Jun, 2023

鲁棒自动数据聚类：狄利克雷过程遇见中位数均值

通过整合基于模型和基于质心的方法，提出了一种高效且自动的聚类技术，解决噪声对聚类质量的影响，并确保无需提前指定聚类数的优点。在模拟和真实数据集上进行了严格评估和统计保证，表明我们提出的方法优于现有先进聚类算法。

Nov, 2023

无聚类中心的模糊 K 均值聚类

本文提出了一种新颖的模糊 K-Means 聚类算法，通过距离矩阵计算获得成员矩阵，从而完全消除了对聚类中心的依赖，增强了距离测量和算法的性能与鲁棒性。实验证明了该算法的有效性。

Apr, 2024

具有群组成员身份不确定性集合的鲁棒公平聚类

我们研究了典型的公平聚类问题，其中每个聚类被约束为每个群组的人口级别表达。尽管引起了很大的关注，但对于每个点的群组成员资格的不完全知识的显著问题仅仅是肤浅地得到解决。在本文中，我们考虑了分配的群组成员资格存在误差的情况。我们引入了一个简单且可解释的误差模型家族，需要决策者提供少量参数。然后，我们提出了一个具有可证明鲁棒性保证的公平聚类算法。我们的框架使决策者能够在鲁棒性和聚类质量之间进行权衡。与以前的工作不同，我们的算法有最坏情况下的理论保证。最后，我们在真实世界的数据集上验证了我们的算法的性能，并展示了其优于现有基准的表现。

Jun, 2024

基于参数熵的 k-means 聚类图像数据集的聚类中心初始化

通过使用参数熵以基于熵的质心初始化方法对图像数据进行 k-means 性能分析，并提出了适用于一般图像数据集的最佳熵测量，我们观察到对于不同的数据集，不同的熵比传统方法提供更好的结果。我们在 Satellite、Toys、Fruits、Cars、Brain MRI 和 Covid X-Ray 的数据集上应用了我们提出的算法。

Aug, 2023

分布式部分聚类

提出了一种在分布式环境下运行的算法来解决部分聚类问题，包括 k 中心，k 中位数和 k 均值等，旨在提高通信效率和解决噪音和数据不确定性带来的影响。

Mar, 2017

论基本公平聚类的代价

本文提出了针对多个保护类的公平聚类方法，并且提出了一种松散的公平概念，在这种概念下，可以对所有经典聚类目标进行双标准常数因子近似，这是通过将任意现有不公平的（整数）解和公平的（分数）线性规划解结合起来实现的。

Nov, 2018

关于在图像检索中质心的不合理有效性

本文提出了在训练和检索中使用平均质心表示法的图像检索方法。通过对类的单个嵌入进行聚合表示类，无论在嵌入稳定性还是检索速度上都有出色的表现。在两个数据集上的实验表明，该方法在时尚检索和 ReID 应用中具有优越性。

Apr, 2021

扰动鲁棒性下的聚类

通过小乘的扰动，可在目标基础聚类问题中进行最优聚类，本文提供了几个在此框架内的结果并且基于新的关联准则提供了基于中心的和最小和聚类的算法。

Dec, 2011