高维重叠高斯混合模型 (GMM) 数据的二元分类的贝叶斯最优决策边界的闭合表达式会根据类协方差的特征结构而变化。通过对由真实数据启发的合成 GMM 数据进行的实验,我们从经验上证明了深度神经网络在分类训练中学习预测器可以近似得到最优分类器。我们进一步拓展了对真实数据训练的网络的研究,观察到决策阈值与协方差的特征向量相关而不是特征值,从而反映了我们 GMM 分析的结果。这为神经网络从错综复杂的分布中执行概率推断和提取统计模式的能力提供了理论洞见。
May, 2024
提供了一种有效的算法,用于鲁棒聚类混合的两个任意高斯分布,该算法将扩展到鲁棒聚类混合的分布更广泛的情况,通过使用基于等位置和费舍尔判别式的新可辨识性标准和相应的固定度数的平方和凸松弛。
Nov, 2019
该研究提出了一种新颖的算法用于估计一维高斯混合模型的参数,利用傅里叶数据中的 Hankel 结构,解决了方差和组分数量同时的问题;同时揭示了有限独立同分布样本情况下,估计高斯混合模型的组分数量的基本极限,并验证了算法在似然度、AIC 和 BIC 等方面比 EM 算法表现更好。
Apr, 2024
研究了在高维高斯混合假设下,少量数据受到对手损坏的情况下的高效可学习性,提出了一种多项式算法并证明了在成分经过配对后在总变异距离上分离时,该问题是可多项式学习的;这种算法是第一个可处理 $k=2$ 的高斯混合问题的多项式时间算法,并使用基于 Sum-of-Squares 证明算法的技术,提出了一种新的用于高斯混合的鲁棒可辨识性证明方法和使用 SoS 可证明的反集中方法和新的特征距离度量组来解决问题。
May, 2020
本文提出了一种基于 isotropic PCA 的 affine-invariant 聚类算法,该算法在混合模型输入的情况下有很强的保证力,特别是在对两个任意高斯混合的分类中结果最佳,对于超过两个的混合,只要存在一个低维度的子空间满足重叠很小的条件,即可得到良好的结果。
Apr, 2008
本文提出了一种可以在多项式时间内确定高斯混合分布的组成部分的算法,其核心是 “距离集中” 结果,使用等周不等式,它们建立了根据混合分布生成的两个点之间的距离的概率分布的界限,同时还形式化了将高斯混合拟合到非结构化数据的最大似然问题。
Mar, 2005
本文介绍了一种新的方法来量化元音重叠。通过同时建模所有感兴趣的声学维度,并通过从模型中模拟分布来计算元音重叠程度,解决了先前使用多元测量和控制不平衡数据和外部因素之间的紧张关系的问题。使用模型化的分布来计算巴氏距亲显著提高了结果,而多元和单元建模之间的差异微妙。
Jun, 2024
本文提出并验证八种数据分布度量方法,相对于现有方法,其中大部分具有改进效果,建议使用一种基于主要成分的度量方法和一种基于熵的度量方法来评估模型的数据分布情况。
Dec, 2022
用 Gromov-Wasserstein 距离的下界,通过对所有数据矩计算,基于内在和多尺度的方法对比数据流形。实验证明,该方法能够有效地识别不同维度未对齐数据的结构,并展示了在评估生成模型质量方面的功效。
May, 2019
本研究提供了一种计算效率高、统计一致的基于矩的混合高斯估计算法,通过简单的谱分解技术,无需额外的最小分离条件,在一般位置上获取成分均值的低阶观测矩,从而通过排除计算和信息理论方面的障碍以便混合模型的高效估计,当混合成分具有一般位置和球形协方差时,与独立成分分析相关的估计问题得到了一些联系。
Jun, 2012