由样本稳定性驱动的深度嵌入聚类
本文提出了一种同时学习特征表示和聚类分配的深度神经网络方法 —— 深度嵌入聚类(DEC),该方法可将数据空间映射到低维特征空间,并在此优化聚类目标函数,实验结果表明,DEC 在图像和文本语料库方面的表现显著超过现有的最先进方法。
Nov, 2015
通过深度自编码器实现非线性降维和聚类,优化作为聚类过程的自编码器,避免之前聚类算法中离散目标的缺陷,无需先验知识即可进行聚类,实验证明该算法优于状态的聚类方案并具有普适性。
Mar, 2018
该研究提出了一种名为 DEPICT 的新型深度嵌入式正则化聚类模型,该模型使用多层卷积自编码器和多项式 logistic 回归函数,通过相对熵最小化方法实现效率和精确性高效的数据映射和聚类分配,可以在无标签数据进行超参数调整的真实世界聚类任务中发挥其优越性和更快的运行时间。
Apr, 2017
通过将 $k$-means 聚类算法重写为最优传输任务,并加入熵正则化,我们提出了一种全新的方法,其中嵌入是由深度神经网络执行的,表明与现有的基于软 $k$-means 的最新方法相比,我们的最优传输方法提供更好的无监督准确度,不需要预训练阶段。
Oct, 2019
使用成对相似度的自监督方法提出了一种新颖的深度聚类框架(DCSS),通过形成类似于高维球的相似数据点的群体,并在聚类特定损失下训练自编码器,在自编码器的潜空间中形成超球体,使用自编码器第一阶段得到的潜空间作为第二阶段的输入,通过成对相似度方法在 K 维空间中进行聚类,实验结果表明两个阶段的有效性。
May, 2024
高维数据集在各个学科的统计建模中带来了很大的挑战,需要高效的降维方法。深度学习方法通过降维的潜在特征空间从复杂数据中提取关键特征,有着广泛的应用,从生物信息学到地球科学等领域。本研究通过引入一个新的工作流程来评估这些潜在空间的稳定性,确保后续分析的一致性和可靠性。该工作流程囊括了三种稳定性类型:样本稳定性、结构稳定性和推断稳定性,并引入了一套综合评估指标。研究结果揭示了潜在特征空间固有的不稳定性,并证明了该工作流程在量化和解释这些不稳定性方面的功效。这项工作推进了对潜在特征空间的理解,促进了深度学习在各种分析工作流中的模型可解释性和质量控制,为更加明智的决策提供了基础。
Feb, 2024
提出 Self-Evolutionary Clustering (Self-EvoC) 框架,采用模糊理论识别异常数据点并采用自我监督分类器生成目标分布以实现分类。实验证明,该方法优于现有 deep clustering 方法。
Feb, 2022