该论文介绍了一种基于众包模型的图像聚类方法,可应对无法得知聚类数目的情况,该方法的有效性已通过在多个人工数据集上的应用得到了证明。
Oct, 2016
提出了一种计算理论和半监督聚类算法,将聚类定义为根据所选的聚类原则和度量方法获得数据分组,使每个组不包含异常值,所有其他示例被认为是边缘点,孤立的异常值、异常簇或未知簇。
Jun, 2023
通过整合基于模型和基于质心的方法,提出了一种高效且自动的聚类技术,解决噪声对聚类质量的影响,并确保无需提前指定聚类数的优点。在模拟和真实数据集上进行了严格评估和统计保证,表明我们提出的方法优于现有先进聚类算法。
Nov, 2023
本文提出了一种新颖的模糊 K-Means 聚类算法,通过距离矩阵计算获得成员矩阵,从而完全消除了对聚类中心的依赖,增强了距离测量和算法的性能与鲁棒性。实验证明了该算法的有效性。
Apr, 2024
我们研究了典型的公平聚类问题,其中每个聚类被约束为每个群组的人口级别表达。尽管引起了很大的关注,但对于每个点的群组成员资格的不完全知识的显著问题仅仅是肤浅地得到解决。在本文中,我们考虑了分配的群组成员资格存在误差的情况。我们引入了一个简单且可解释的误差模型家族,需要决策者提供少量参数。然后,我们提出了一个具有可证明鲁棒性保证的公平聚类算法。我们的框架使决策者能够在鲁棒性和聚类质量之间进行权衡。与以前的工作不同,我们的算法有最坏情况下的理论保证。最后,我们在真实世界的数据集上验证了我们的算法的性能,并展示了其优于现有基准的表现。
Jun, 2024
通过使用参数熵以基于熵的质心初始化方法对图像数据进行 k-means 性能分析,并提出了适用于一般图像数据集的最佳熵测量,我们观察到对于不同的数据集,不同的熵比传统方法提供更好的结果。我们在 Satellite、Toys、Fruits、Cars、Brain MRI 和 Covid X-Ray 的数据集上应用了我们提出的算法。
Aug, 2023
提出了一种在分布式环境下运行的算法来解决部分聚类问题,包括 k 中心,k 中位数和 k 均值等,旨在提高通信效率和解决噪音和数据不确定性带来的影响。
Mar, 2017
本文提出了针对多个保护类的公平聚类方法,并且提出了一种松散的公平概念,在这种概念下,可以对所有经典聚类目标进行双标准常数因子近似,这是通过将任意现有不公平的(整数)解和公平的(分数)线性规划解结合起来实现的。
Nov, 2018
本文提出了在训练和检索中使用平均质心表示法的图像检索方法。通过对类的单个嵌入进行聚合表示类,无论在嵌入稳定性还是检索速度上都有出色的表现。在两个数据集上的实验表明,该方法在时尚检索和 ReID 应用中具有优越性。
Apr, 2021
通过小乘的扰动,可在目标基础聚类问题中进行最优聚类,本文提供了几个在此框架内的结果并且基于新的关联准则提供了基于中心的和最小和聚类的算法。
Dec, 2011