基于几何正则化的不完全嘈杂成对注释深度聚类
本文提出一种利用深度神经网络来建模聚类任务中数据间关系从而提高聚类效果的算法,名称为 Deep Discriminative Clustering (DDC)。DDC 采用全局和局部约束对关系进行调整,通过迭代式训练得到高水平的表征,并将其作为聚类中心进行直接聚类。实验证明,DDC 在图像、文本和音频数据集上表现出比当前方法更佳的聚类效果。
May, 2019
本论文提出了一种名为 DCCM 的新型聚类框架,可以从三个方面探索和充分利用未标记数据中的各种相关性,通过伪标签监督,全面的研究特征对输入空间的图像变换的稳健性,并将 triplet 互信息应用于聚类问题中,从而进一步有助于学习更有区分性的特征。在多个数据集上进行了广泛的实验,取得了良好的性能,例如在 CIFAR-10 上达到 62.3%的聚类准确度,比现有最先进方法高出 10.1%。
Apr, 2019
本论文考虑基于有噪声的数据子集对聚类问题进行半监督学习,提出一种新的深度生成模型和统计关系模型相结合的方法,并采用贝叶斯推断策略,采用快速(自然梯度)随机变分推断算法进行推断,实验结果显示该方法优于以往的基于众包的聚类方法。
Oct, 2018
本篇研究提出了一种基于图神经网络和图对比学习的协作过滤框架,通过自我监督学习进行自适应增强,实现目的的解耦和噪声抑制,将学习到的解耦表示与全局上下文结合,相比于现有的解决方案,具有更好的性能表现。
May, 2023
该论文介绍了一种新的深度聚类方法 - Deep Robust Clustering (DRC),它从两方面同时考虑了语义聚类和特征表现,从而增加了跨类别差异并同时减少了类内差异,且通过数据增强和对比损失的最小化在多项基准测试中显著提高了准确性。
Aug, 2020
使用成对相似度的自监督方法提出了一种新颖的深度聚类框架(DCSS),通过形成类似于高维球的相似数据点的群体,并在聚类特定损失下训练自编码器,在自编码器的潜空间中形成超球体,使用自编码器第一阶段得到的潜空间作为第二阶段的输入,通过成对相似度方法在 K 维空间中进行聚类,实验结果表明两个阶段的有效性。
May, 2024
通过对样本进行简单而有效的选择算法,我们将训练样本划分为一个干净集和一个带噪声集,使用高斯混合模型来建模相似样本对的相似度分布,从而能够更可靠地判断各个样本的标签置信度,并在各种基准数据集上展示了超越现有方法的显著改进。
Apr, 2024
该研究介绍了一种利用特征空间中训练样例的相似性,鼓励每个样例预测与其最近邻居相似的学习方法,用于从带有噪声标签的数据中学习,并且在多个数据集上展现出良好的分类精度。
Feb, 2022
该论文提出了一种基于无标签干扰数据集训练深度卷积神经网络的新型框架,并使用一个无向图模型来描述干净和嘈杂标签之间的关系,在监督学习过程中学习这个模型。该模型在图像标注问题上应用,并在 CIFAR-10 和 MS COCO 数据集上展示出有效的标注效果和在训练中实现了减少标签噪声的效果。
May, 2017