应用小方差渐近方法直接处理贝叶斯非参数模型的后验概率,得到一种超越聚类的特征学习目标函数,并提出一些易于实现的新算法,这些算法的效果被实验结果验证。
Dec, 2012
本文从贝叶斯非参数的角度出发,重新审视了 k-means 聚类算法。通过分析 Dirichlet 过程混合物的 Gibbs 抽样算法,我们发现这个算法在极限下接近于硬聚类算法,可以优雅且单调地最小化一个类似 k-means 的聚类目标,包括对聚类数的惩罚。我们将这个方法推广到了多个数据集的聚类情况,并讨论了进一步的扩展,包括门槛特征向量的光谱松弛和在图中不需要固定聚类数的归一化割图聚类算法。
Nov, 2011
提供了一种有效的算法,用于鲁棒聚类混合的两个任意高斯分布,该算法将扩展到鲁棒聚类混合的分布更广泛的情况,通过使用基于等位置和费舍尔判别式的新可辨识性标准和相应的固定度数的平方和凸松弛。
Nov, 2019
通过贝叶斯框架,使用稀疏源的混合问题,提出了一种对未观测源具有零原子和高斯分布的加权混合作为前任分布以促进稀疏度的下完备字典学习任务。
Aug, 2009
本文研究了在数据量大、似然不为高斯分布和协方差函数参数后验估计方面如何高效地计算,提出了一种稀疏的变分近似方法和混合蒙特卡洛采样策略,实现了同时估计函数值和协方差参数。
Jun, 2015
本文提出了一种可以在多项式时间内确定高斯混合分布的组成部分的算法,其核心是 “距离集中” 结果,使用等周不等式,它们建立了根据混合分布生成的两个点之间的距离的概率分布的界限,同时还形式化了将高斯混合拟合到非结构化数据的最大似然问题。
Mar, 2005
在分布式环境中,通过提出一种新的估计方法,允许本地节点创建新元素并通过概率一致性方案合并相应聚类的组件,同时保持估计的一致性,此法可在分布式和异步环境中实现高可扩展性。
Sep, 2017
本文研究了用于密度估计的柏努利处理(DP)混合模型的计算问题,并提出了一种可用于大数据集的搜素算法。
Jul, 2009
提出了一种使用广义贝塔分布的新型正态尺度混合类,并通过该类介绍了新的层次结构,从而发展了一类变分贝叶斯近似,以更高效地应对海量数据集。
Jul, 2011
提出了一种新的多聚类方法,该方法使用非参数贝叶斯方法进行模型推断,使用变分推断来求解,该方法在处理高维度数据时更为适用,在聚类时模型同时处理了数值型和分类型变量,应用该方法于真实数据集时能够推出数据集的聚类结构信息,并可应用于抑郁症数据集上。
Oct, 2015