高斯混合模型鲁棒聚类
本研究提供了一种计算效率高、统计一致的基于矩的混合高斯估计算法,通过简单的谱分解技术,无需额外的最小分离条件,在一般位置上获取成分均值的低阶观测矩,从而通过排除计算和信息理论方面的障碍以便混合模型的高效估计,当混合成分具有一般位置和球形协方差时,与独立成分分析相关的估计问题得到了一些联系。
Jun, 2012
本文提供了在高维情况下学习高斯混合物的准确最小值界限和基本限制,研究表明,如果存在决定均值分离的随机维度的稀疏子集,则样本复杂度只取决于相关维度的数量和平均分离,可通过简单的计算有效过程来实现;结果为最近结合特征选择和聚类的方法提供了理论基础的第一步。
Jun, 2013
本文提出了一种新的鲁棒的自下而上聚类算法,并展示了在满足一定自然属性且传统算法失效的情况下,该算法可以被用来进行准确的聚类。同时,该算法也被适用于归纳设置,并在合成数据和真实数据集上的实验表明,在存在噪音时,与其他分层算法相比,该算法可以获得更好的表现。
Jan, 2014
研究了在高维高斯混合假设下,少量数据受到对手损坏的情况下的高效可学习性,提出了一种多项式算法并证明了在成分经过配对后在总变异距离上分离时,该问题是可多项式学习的;这种算法是第一个可处理$k=2$的高斯混合问题的多项式时间算法,并使用基于Sum-of-Squares证明算法的技术,提出了一种新的用于高斯混合的鲁棒可辨识性证明方法和使用SoS可证明的反集中方法和新的特征距离度量组来解决问题。
May, 2020
本文介绍了学习高斯混合分布和算法鲁棒性统计的自然融合,提出了第一个可靠的算法,用于学习任意数量的高斯混合物,且仅需要混合权重(有界分数性)和成分之间的总变差距离与零保持一定距离的温和假设条件。算法的核心是一种新的方法,通过对某些生成函数应用一系列精心选择的微分运算来证明维度无关的多项式可辨识性,这些生成函数不仅编码了我们想要学习的参数,还编码了我们想要解决的多项式方程系统。我们展示了如何直接使用我们推导出的符号身份来分析自然的平方和松弛问题。
Nov, 2020
在固定$k$个任意高斯分布的混合物和常量级别的数据污染的情况下,我们提出了一个用于稳健估计的多项式时间算法。该算法的主要工具有基于平方和方法的有效局部聚类算法和允许Frobenius范数和低秩项误差的新型张量分解算法。
Dec, 2020
对于基于高斯混合模型的鲁棒聚类,讨论了一些关键问题,包括异常值的正式定义,异常值和聚类之间的歧义,鲁棒聚类与聚类数量估计之间的交互作用,鲁棒聚类(不仅仅是)对调整决策的重要依赖,以及现有的聚类稳定性度量在处理异常值时的缺点。
Aug, 2023
研究了混合有界协方差分布的聚类问题,使用细粒度分离假设;提供了用于聚类任务的多项式时间算法,并指出了在细粒度均值分离假设下精确聚类是信息理论上不可能的;引入了聚类细化的概念并证明了可以高效计算出样本的精确聚类细化;此外,根据先前工作中的一个变体条件,我们的算法输出准确聚类,甚至适用于一般权重的混合物。
Dec, 2023