本研究提出了一种使用深度学习进行无监督非参数聚类的方法,首先利用深度学习进行特征表示和降维,然后在最大边际框架下进行非参数聚类,最后在深信念网络中优化模型参数。实验结果表明我们的方法优于现有竞争方法。
Jan, 2015
我们研究了一个变分自编码器模型(VAE)的变体,其中高斯混合作为先验分布,通过深生成模型实现无监督聚类,通过最小信息约束启发式,缓解了过度正则化问题,并在合成数据、MNIST 和 SVHN 上证明了模型的性能。
Nov, 2016
提出了一种无监督生成聚类方法Variational Deep Embedding (VaDE),使用高斯混合模型和神经网络来建模数据生成过程,并在VaDE中使用变分推断实现更好的聚类效果,并可生成高度逼真的样本,更广泛的混合模型也可以轻松集成。
通过深度自编码器实现非线性降维和聚类,优化作为聚类过程的自编码器,避免之前聚类算法中离散目标的缺陷,无需先验知识即可进行聚类,实验证明该算法优于状态的聚类方案并具有普适性。
Mar, 2018
本研究提出优化自动编码器的磨损和判别力对数的预训练阶段,以获得更高的聚类准确性和更快的收敛速度。
May, 2018
本论文考虑基于有噪声的数据子集对聚类问题进行半监督学习,提出一种新的深度生成模型和统计关系模型相结合的方法,并采用贝叶斯推断策略,采用快速(自然梯度)随机变分推断算法进行推断,实验结果显示该方法优于以往的基于众包的聚类方法。
Oct, 2018
这篇论文提出了一种基于深度自编码器混合聚类(DAMIC)算法,该算法通过聚类网络将数据转化到另一个空间,并且提出了一种集合自编码器来表示每一个聚类,同时聚类算法共同学习非线性数据表述和集合自编码器,通过最小化混合自编码器网络的重构损失,找到最优的聚类,实验结果显示该方法在图像和文本上均优于现有技术。
Dec, 2018
我们提出了一种新的深度聚类网络,利用信息理论差异度量的鉴别能力,提出了一种新颖的损失函数,避免了聚类分区的退化结构。
Feb, 2019
本文提出了一种无监督的生成性聚类框架,将变分信息瓶颈和高斯混合模型相结合。使用变分信息瓶颈方法将潜空间建模为高斯混合物,并导出了一个代价函数的界限,并提供了一种可计算它的变分推断类型算法。通过神经网络参数化编码器映射,并通过蒙特卡罗采样逼近边界,并用随机梯度下降进行优化。提供了真实数据集的数值结果,证明了我们方法的有效性。
May, 2019
本文介绍了一种有效的深度聚类方法,该方法使用了分裂/合并框架、动态体系结构自适应于不断变化的聚簇数量K,并且不需要预先指定K值。论文证明了这种无需预先指定簇数的非参数方法在ImageNet等数据集上,超越了现有的基于深度学习和传统的非参数聚类方法,并展示了在数据集不平衡时,预先指定K值的方法的性能下降。
Mar, 2022