基于几何正则化的不完全嘈杂成对注释深度聚类

ICMLMay, 2023

基于几何正则化的不完全嘈杂成对注释深度聚类

Deep Clustering with Incomplete Noisy Pairwise Annotations: A Geometric Regularization Approach

Tri Nguyen, Shahana Ibrahim, Xiao Fu

TL;DR本论文通过研究深度约束聚类（DCC）的一种新的逻辑损失函数，探讨其理论性质，并提出了一种基于几何因子分析的新的损失函数来对抗噪声注释。该方法经过多个数据集的测试验证，表明即使在未知注释混淆的情况下，我们提出的学习标准下数据成员仍可被证明地识别。

Abstract

The recent integration of deep learning and pairwise similarity annotation-based constrained clustering -- i.e., $\textit{deep constrained clustering}$ (DCC) -- has proven effective for incorporating weak supervision

deep constrained clustering pairwise similarity weak supervision logistic loss function geometric factor analysis

发现论文，激发创造

深层判别聚类分析

本文提出一种利用深度神经网络来建模聚类任务中数据间关系从而提高聚类效果的算法，名称为 Deep Discriminative Clustering (DDC)。DDC 采用全局和局部约束对关系进行调整，通过迭代式训练得到高水平的表征，并将其作为聚类中心进行直接聚类。实验证明，DDC 在图像、文本和音频数据集上表现出比当前方法更佳的聚类效果。

May, 2019

图像聚类的深度全面相关挖掘

本论文提出了一种名为 DCCM 的新型聚类框架，可以从三个方面探索和充分利用未标记数据中的各种相关性，通过伪标签监督，全面的研究特征对输入空间的图像变换的稳健性，并将 triplet 互信息应用于聚类问题中，从而进一步有助于学习更有区分性的特征。在多个数据集上进行了广泛的实验，取得了良好的性能，例如在 CIFAR-10 上达到 62.3％的聚类准确度，比现有最先进方法高出 10.1％。

Apr, 2019

基于深度生成模型的半众包聚类

本论文考虑基于有噪声的数据子集对聚类问题进行半监督学习，提出一种新的深度生成模型和统计关系模型相结合的方法，并采用贝叶斯推断策略，采用快速（自然梯度）随机变分推断算法进行推断，实验结果显示该方法优于以往的基于众包的聚类方法。

Oct, 2018

解耦对比协同过滤

本篇研究提出了一种基于图神经网络和图对比学习的协作过滤框架，通过自我监督学习进行自适应增强，实现目的的解耦和噪声抑制，将学习到的解耦表示与全局上下文结合，相比于现有的解决方案，具有更好的性能表现。

May, 2023

对比学习实现的深度鲁棒聚类

该论文介绍了一种新的深度聚类方法 - Deep Robust Clustering (DRC)，它从两方面同时考虑了语义聚类和特征表现，从而增加了跨类别差异并同时减少了类内差异，且通过数据增强和对比损失的最小化在多项基准测试中显著提高了准确性。

Aug, 2020

自监督的深度聚类与点对相似度

使用成对相似度的自监督方法提出了一种新颖的深度聚类框架（DCSS），通过形成类似于高维球的相似数据点的群体，并在聚类特定损失下训练自编码器，在自编码器的潜空间中形成超球体，使用自编码器第一阶段得到的潜空间作为第二阶段的输入，通过成对相似度方法在 K 维空间中进行聚类，实验结果表明两个阶段的有效性。

May, 2024

噪声标签学习的成对相似度分布聚类

通过对样本进行简单而有效的选择算法，我们将训练样本划分为一个干净集和一个带噪声集，使用高斯混合模型来建模相似样本对的相似度分布，从而能够更可靠地判断各个样本的标签置信度，并在各种基准数据集上展示了超越现有方法的显著改进。

Apr, 2024

基于深度分歧的聚类方法

我们提出了一种新的深度聚类网络，利用信息理论差异度量的鉴别能力，提出了一种新颖的损失函数，避免了聚类分区的退化结构。

Feb, 2019

利用邻域一致性进行含噪标签学习

该研究介绍了一种利用特征空间中训练样例的相似性，鼓励每个样例预测与其最近邻居相似的学习方法，用于从带有噪声标签的数据中学习，并且在多个数据集上展现出良好的分类精度。

Feb, 2022

训练深度判别神经网络对抗标签噪声的鲁棒性

该论文提出了一种基于无标签干扰数据集训练深度卷积神经网络的新型框架，并使用一个无向图模型来描述干净和嘈杂标签之间的关系，在监督学习过程中学习这个模型。该模型在图像标注问题上应用，并在 CIFAR-10 和 MS COCO 数据集上展示出有效的标注效果和在训练中实现了减少标签噪声的效果。

May, 2017