无截断的 DPMM 混合推理
在分布式环境中,通过提出一种新的估计方法,允许本地节点创建新元素并通过概率一致性方案合并相应聚类的组件,同时保持估计的一致性,此法可在分布式和异步环境中实现高可扩展性。
Sep, 2017
本文介绍一种新型的 DP 重新参数化方法,该方法在聚类分析中广泛使用,能够实现 DP 的并行学习,从而提高了学习速度和效率,同时该方法不需要改变模型并且能够保持标准后验分布不变。
Apr, 2013
通过使用合适的统计量,本文提出了一种新的 DPMM(Dirichlet Process Mixture Models)的分布式马尔科夫链蒙特卡罗(MCMC)推理方法(DisCGS)。该方法使用了折叠的吉布斯采样器,并且特别设计用于在独立异构的机器间处理分布式数据,使其在横向联合学习中具备应用能力。我们的方法取得了非常有前景的结果和显著的可扩展性。例如,对于包含 10 万个数据点的数据集,集中式算法需要大约 12 小时完成 100 次迭代,而我们的方法仅需 3 分钟完成相同的迭代次数,将执行时间缩短了 200 倍,同时不影响聚类性能。
Dec, 2023
提出了一种基于依赖狄利克雷过程混合模型(DDPMM)的新的聚类算法,用于聚类包含未知数量的进化聚类的批量连续数据。该算法通过对 DDPMM 的 Gibbs 抽样算法进行低方差渐近分析而得出,提供类似于 k-means 算法的收敛保证的硬聚类。通过移动高斯聚类的合成测试和真实的 ADS-B 飞机轨迹数据测试的实证结果表明,与当代概率和硬聚类算法相比,该算法在提供更高准确性的同时需要更少的计算时间。
May, 2013
该研究介绍了一种针对文档群集的 Hierarchical Dirichlet process (HDP) 模型,描述了一种新的 split-merge MCMC 采样算法用于后验推断,这种算法可以显著改善传统的 Gibbs 采样,并且给出了一些因数据属性而导致的改进理解。
Jan, 2012
本文介绍了一种基于广义 Polya 弹珠模型的时间变化 Dirichlet 过程混合模型,并通过马尔科夫链蒙特卡罗和顺序蒙特卡罗方法进行推断,以此解决了在数据分布随时间变化的情况下使用传统 DPMs 模型不准确的问题。作者在多个应用中验证了该模型。
Jun, 2012
提出一种适用于在线聚类和参数估计的低复杂度的序列推理过程,通过更新超参数并使用共轭先验假设,提出了易于计算的条件似然函数的闭形式参数化表达式和 Dirichlet 过程的自适应低复杂度设计。实验结果表明该方法优于其他在线最先进的方法。
Sep, 2014
本文提出了一种混合推理算法,结合了 MCMC 和基于树的推理方法(IBHC)的优点,用于归一化随机测量(NRM)混合模型,该算法通过树引导 MCMC 进行有效提议,从而保证了收敛性和快速收敛。
Nov, 2015