鲁棒聚类中的一些问题
提供了一种有效的算法,用于鲁棒聚类混合的两个任意高斯分布,该算法将扩展到鲁棒聚类混合的分布更广泛的情况,通过使用基于等位置和费舍尔判别式的新可辨识性标准和相应的固定度数的平方和凸松弛。
Nov, 2019
我们研究了典型的公平聚类问题,其中每个聚类被约束为每个群组的人口级别表达。尽管引起了很大的关注,但对于每个点的群组成员资格的不完全知识的显著问题仅仅是肤浅地得到解决。在本文中,我们考虑了分配的群组成员资格存在误差的情况。我们引入了一个简单且可解释的误差模型家族,需要决策者提供少量参数。然后,我们提出了一个具有可证明鲁棒性保证的公平聚类算法。我们的框架使决策者能够在鲁棒性和聚类质量之间进行权衡。与以前的工作不同,我们的算法有最坏情况下的理论保证。最后,我们在真实世界的数据集上验证了我们的算法的性能,并展示了其优于现有基准的表现。
Jun, 2024
本研究提出了一种新的检测离群值的高效算法,用于聚类混合的高斯模型,这种方法是鲁棒的,可以处理在数据中有少部分的失真或错误,它依赖于 TV 距离和方差有限度等假定条件,并使用极小化两种偏差的方法来修复度量误差和离群值异常。
May, 2020
提出了一种贝叶斯距离聚类方法,它使用基于数据点之间成对差异的先验知识以取得更强的鲁棒性,可以在距离聚类和模型聚类之间找到一个平衡点,并通过其在脑基因表达数据的聚类应用中展示了其性能
Oct, 2018
本文介绍了一种基于多元高斯模型的鲁棒聚类方法 ——“最佳不适当极大似然估计法(OTRIMLE)”,并针对高斯混合模型中的异常值、噪音成分、t - 分布混合和修剪聚类方法给出了综合性的仿真实验。结果表明 OTRIMLE 方法总体表现最佳。
Jun, 2014
本文提出了一个基于度量空间的 “好聚类” 的理论框架,展示了如果存在好的聚类,则在许多情况下可以轻易地找到它,因此与流行观点相反,聚类不应被视为一项艰苦的任务。
May, 2012
本文考虑了 Bilu 和 Linial(2010)提出的模型,研究了最佳聚类不发生变化的问题,我们发现即使问题是 NP 困难的,有时候也可能获得有效算法,这些算法对于特定的多项式扰动是鲁棒的。同时,我们证明了该区间内的乘法鲁棒性参数可能太强,以至于聚类问题变得微不足道,只有一个较窄的区间是有趣的。
Jul, 2011