使用截断数据学习混合高斯模型
在高维情况下,使用平滑分析方法可以在多项式时间内使用多项式数量的样本学习带有随机扰动参数的高斯混合模型,通过利用高斯分布的高阶矩的组合结构并推导其对称性,探索新的高斯混合物的时刻张量的分解方法以及构建结构化随机矩阵的奇异值的下界。
Mar, 2015
在满足差分隐私的约束下,研究了估计混合高斯模型问题。通过使用新的框架,证明了高斯模型类的混合模型是可私密学习的,得到了估计混合高斯模型所需的样本数量的有界性,且不对 GMMs 作出任何结构性假设。
Sep, 2023
在固定 $k$ 个任意高斯分布的混合物和常量级别的数据污染的情况下,我们提出了一个用于稳健估计的多项式时间算法。该算法的主要工具有基于平方和方法的有效局部聚类算法和允许 Frobenius 范数和低秩项误差的新型张量分解算法。
Dec, 2020
本文提出了一种可以在多项式时间内确定高斯混合分布的组成部分的算法,其核心是 “距离集中” 结果,使用等周不等式,它们建立了根据混合分布生成的两个点之间的距离的概率分布的界限,同时还形式化了将高斯混合拟合到非结构化数据的最大似然问题。
Mar, 2005
给出了一个新的学习高斯混合模型的算法,其目标是通过扩散模型中的得分函数以及多项式回归来高效学习混合高斯分布,对于具有最小权重假设的情况下,计算出来的误差和时间复杂度具有准多项式级别的优势,并扩展到具有支持在常数半径范围内的多个球的混合高斯的情况。
Apr, 2024
提出了一种基于混合学习算法的 PAC 学习方法,该算法可用于密度估计中的概率分布,其中包含了学习概率分布,学习混合分布等,其中混合分布包括轴向高斯混合分布,高斯混合分布和对数凹分布。
Jun, 2017
本文介绍了学习高斯混合分布和算法鲁棒性统计的自然融合,提出了第一个可靠的算法,用于学习任意数量的高斯混合物,且仅需要混合权重(有界分数性)和成分之间的总变差距离与零保持一定距离的温和假设条件。算法的核心是一种新的方法,通过对某些生成函数应用一系列精心选择的微分运算来证明维度无关的多项式可辨识性,这些生成函数不仅编码了我们想要学习的参数,还编码了我们想要解决的多项式方程系统。我们展示了如何直接使用我们推导出的符号身份来分析自然的平方和松弛问题。
Nov, 2020