朝向适合K均值算法的空间:同时进行深度学习与聚类
本文介绍了一种基于增强版k-means聚类算法的深度卷积神经网络,该算法通过无监督学习技术利用分层特征来减少相关参数的数量,从而提高了测试分类精度。作者进一步展示了学习深度卷积神经网络各层之间的连接能够提高网络在少量标记数据上的训练能力,最终在STL-10数据集上获得74.1%的测试准确率以及在MNIST数据集上仅有0.5%的测试误差。
Nov, 2015
通过深度自编码器实现非线性降维和聚类,优化作为聚类过程的自编码器,避免之前聚类算法中离散目标的缺陷,无需先验知识即可进行聚类,实验证明该算法优于状态的聚类方案并具有普适性。
Mar, 2018
本文研究了联合聚类和学习表示问题,提出了一种在 $k$-Means 聚类中基于目标函数连续重新参数化的方法,该方法在多个数据集上经过测试证明其在聚类对象的同时学习表示方面的有效性。
Jun, 2018
本研究表明,最近的一些判别模型等价于K-means,并且证明对于常用的逻辑回归后验概率,通过交替方向方法最大化L2正则化的互信息等价于软化和正则化的K-means损失。这一理论分析不仅将最近的一些判别模型直接联系到了K-means,并且提出了一种新的软化和正则化的深度K-means算法,在几个图像聚类基准测试中表现出色。
Oct, 2018
本研究旨在探讨从未标记数据中同时学习K-means聚类和深度特征表示的问题,通过Gumbel-Softmax重参数化技巧的梯度估计器解决了原问题,并通过标准聚类基准测试证明了方法的有效性。
Oct, 2019
通过将 $k$-means聚类算法重写为最优传输任务,并加入熵正则化,我们提出了一种全新的方法,其中嵌入是由深度神经网络执行的,表明与现有的基于软 $k$-means的最新方法相比,我们的最优传输方法提供更好的无监督准确度,不需要预训练阶段。
Oct, 2019
本文提出了一种新的无监督条件生成框架:双循环一致性条件生成对抗网络(DC3-GAN),该框架通过引入编码器-生成器对,使我们在避免生成过程低多样性和潜在特征平凡性的同时,也可以间接地估计真实条件分布,从而 提高聚类性能和分离性能。
Nov, 2019
本文介绍了一种有效的深度聚类方法,该方法使用了分裂/合并框架、动态体系结构自适应于不断变化的聚簇数量K,并且不需要预先指定K值。论文证明了这种无需预先指定簇数的非参数方法在ImageNet等数据集上,超越了现有的基于深度学习和传统的非参数聚类方法,并展示了在数据集不平衡时,预先指定K值的方法的性能下降。
Mar, 2022
基于神经网络的深度聚类在分析高维复杂现实世界数据方面取得了巨大成功,然而现有工作往往忽视了深度聚类中先验知识的融合和利用,本文通过对各种先验知识进行分类,提供了全面的深度聚类方法综述,并提供了五个广泛使用的数据集的基准测试和方法性能分析,希望能够为深度聚类研究提供一些新的见解和启发。
Jun, 2024