该论文提出了一种基于高斯混合模型的数据学习算法,可用于密度估计、数据聚类、高斯混合参数估计等问题,同时考虑了高维情况下的实际问题。
Apr, 2010
本文证明已知的具有相同协方差矩阵和组成部分数量为固定次数多项式的高维混合高斯成分是多项式可学习的,但在低维空间下这种情况不可能存在。通过一种称为Poissonization的技术,将高维混合高斯成分变换为直接解决线性映射的问题。最后,我们将高维困难实例嵌入ICA设置中,建立了低维ICA的指数信息论下界。
Nov, 2013
提出一种无需可分离性假设就能准确学习两个单维高斯混合模型的算法,其样本复杂度优于现有算法,能够有效地处理假设选择的问题。
Dec, 2013
本文介绍了一种基于矩估计的计算方法,并应用新颖且简单的降维技术将上界推广到任意维数$d>1$,同时发现了一些样本复杂度较小的特殊情况,同时我们的结果也适用于在总变异距离上学习混合物的每个组件,其中我们的算法显著提高了样本复杂度。
Apr, 2014
在高维情况下,使用平滑分析方法可以在多项式时间内使用多项式数量的样本学习带有随机扰动参数的高斯混合模型, 通过利用高斯分布的高阶矩的组合结构并推导其对称性,探索新的高斯混合物的时刻张量的分解方法以及构建结构化随机矩阵的奇异值的下界。
Mar, 2015
本文提出了一种统计查询下限技术,用于解决高维学习问题中高斯分布的学习和鲁棒性学习问题,并得出了样本复杂度和计算复杂度之间存在的超多项式差距,同时提供了一个新的方法来解决一些相关的无监督估计和测试问题。
Nov, 2016
研究学习高斯分布混合物,当分量分离良好时,需要解决分量之间最小分离的问题,并提出了一个新的算法来处理分量之间分离程度的限制,该算法可以通过粗略的估计获得准确的参数。
Oct, 2017
研究了高维混合的两个高斯类在噪声条件下的学习,正则化方法可以让分类器达到贝叶斯最优性能,同时分析了正则化程度的影响。
Feb, 2020
研究了在高维高斯混合假设下,少量数据受到对手损坏的情况下的高效可学习性,提出了一种多项式算法并证明了在成分经过配对后在总变异距离上分离时,该问题是可多项式学习的;这种算法是第一个可处理$k=2$的高斯混合问题的多项式时间算法,并使用基于Sum-of-Squares证明算法的技术,提出了一种新的用于高斯混合的鲁棒可辨识性证明方法和使用SoS可证明的反集中方法和新的特征距离度量组来解决问题。
May, 2020
聚类是无监督机器学习中的关键问题,如何通过混合模型来研究聚类是常见的。本文首先通过契诺夫散度建立了聚类任何混合模型的一个普遍下界,然后证明在具有次指数尾部的混合模型中,迭代算法可以达到这个下界;此外,对于更适合使用泊松或负二项式混合模型的数据集,我们研究了属于指数族的混合模型,在这种混合模型中,我们证明了一种改进的Lloyd算法——Bregman硬聚类,是速率最优的。
Feb, 2024