本文提出了一种可以在多项式时间内确定高斯混合分布的组成部分的算法,其核心是 “距离集中” 结果,使用等周不等式,它们建立了根据混合分布生成的两个点之间的距离的概率分布的界限,同时还形式化了将高斯混合拟合到非结构化数据的最大似然问题。
Mar, 2005
该论文提出了一种基于高斯混合模型的数据学习算法,可用于密度估计、数据聚类、高斯混合参数估计等问题,同时考虑了高维情况下的实际问题。
Apr, 2010
本文介绍了三类基于泊松分布的多元分布,探讨了这些模型在解释性和理论方面的不同,通过三个真实数据集的实证实验比较了每类模型的优缺点,并提出了未来的研究方向。
Aug, 2016
本研究通过样本的简化抽样学习了一个代表复杂模型的概率分布,该模型有广泛的应用范围,包括无监督学习,主题模型和协同过滤。
Apr, 2015
在高维情况下,使用平滑分析方法可以在多项式时间内使用多项式数量的样本学习带有随机扰动参数的高斯混合模型,通过利用高斯分布的高阶矩的组合结构并推导其对称性,探索新的高斯混合物的时刻张量的分解方法以及构建结构化随机矩阵的奇异值的下界。
Mar, 2015
基于形状约束函数估计的思路,本文提出了一种估计混合比例和未知分布的方法,研究了其一致性和收敛速率,开发了自动化的无分布有保证的混合比例置信下限估计方法,并分析了在天文与微阵列实验中的应用。
Apr, 2012
介绍了广义双曲线分布的混合模型,相对于高斯混合分布以及其中的多元 t 分布和偏 t 分布,具有一定的优势性能。通过仿真和真实数据,展示了其在参数估计、聚类以及密度估计中的应用和效能。
May, 2013
本文研究了用于密度估计的柏努利处理(DP)混合模型的计算问题,并提出了一种可用于大数据集的搜素算法。
Jul, 2009
本文解决了高维度任意固定数目成分的高斯混合分布在多项式学习方面存在问题的问题,提供了降维方法来将学习高维混合分布降至低维学习问题,并利用实代数几何学工具提供了多项式族分布的学习方法。
《Mixture-Models》是一个开源的 Python 库,用于拟合高斯混合模型及其变种,如 Sparimonious GMM、因子分析混合模型、MClust 模型、学生 t 分布混合模型等。它使用各种一阶 / 二阶优化算法,如梯度下降和牛顿法,通过自动微分工具简化了这些模型的实现和分析,从而帮助扩展这些模型到高维数据。该库提供了用户友好的模型评估工具,如 BIC、AIC 和对数似然估计。该软件包具有很高的可扩展性,允许用户轻松地添加新的分布和优化技术。我们进行了大规模模拟实验,比较了各种基于梯度的方法与期望最大化算法在各种设置下的性能,并确定相应最适合的方法。
Feb, 2024