- 文本引导的图像聚类
利用大规模视觉语言模型,该研究探索了可用于辅助多样化图像聚类的潜力,并提出一种名为 TGAICC 的新方法,通过使用提示来引导不同聚类的发现,并通过一致性聚类的方式将它们聚合在一起。该方法在四个多样化图像聚类基准数据集上表现出优于基于图像和 - CVPR对比均移学习用于广义类别发现
我们提出了一种名为对比均值漂移(CMS)学习的方法,该方法在泛化图像聚类问题中使用经典而强大的均值漂移算法,并结合对比学习框架,通过均值漂移和对比更新的迭代过程来训练图像编码器,以产生具有更好聚类特性的表示。实验证明,在六个公共泛化类别发现 - 重新思考基于聚类条件的扩散模型
通过使用集群分配,我们对图像级别调制的扩散模型进行了全面的实验研究,并阐明了图像集群的个别组件对三个数据集上图像合成的影响。结合图像集群和扩散模型的最新进展,我们表明,给定图像合成的最优集群粒度(可视化组),集群调制可以实现最先进的 FID - 文本引导的图像聚类
通过使用图像标题生成和视觉问答 (VQA) 模型生成文本,并基于生成的文本进行聚类,本研究在八个不同的图像聚类数据集中展示了得到的文本表示经常优于图像特征。此外,我们提出了一种基于计数的聚类解释方法,在聚类准确性不太高的情况下,基于关键词的 - 多级交叉模态对齐图像聚类
我們提出了一種多層次跨模態對齊方法,通過在三個層次(即實例級別、原型級別和語義級別)建立一個更小但更好的語義空間,對跨模態預訓練模型中的對齊進行改進,以提高下游任務的性能。實驗結果清楚地表明了我們新方法的優越性。
- 使用受限玻尔兹曼机进行图像聚类
使用限制玻尔兹曼机 (Restricted Boltzmann Machines) 进行图像聚类任务,通过训练通用 RBM 模型和适应每个测试图像的 RBM 模型,生成嵌入向量用于图像聚类任务,并在实验结果中表明该方法优于 k-means、 - 基于文本条件的图像聚类
本文介绍了一种基于用户指定的文本条件的图像聚类方法,通过利用现代视觉语言模型和大型语言模型,它提供了对聚类结果的直接控制,实验结果表明这种方法能够有效地以多种标准聚类图像,并显著优于基准方法。
- 基于 CLIP 的栅格拼图表示:图像聚类的新视角
无监督表征学习在计算机视觉中对图像聚类至关重要。本论文介绍了基于拼图策略的图像聚类算法 Grid Jigsaw Representation(GJR),并创新了基于预训练的 Grid Jigsaw Representation(pGJR), - 基于注意力机制的深度神经网络关键帧提取
本文提出了一种基于深度自动编码器模型和注意力层的关键帧检测方法,该方法首先使用自动编码器的编码器部分从视频帧中提取特征,并使用 K-means 聚类算法对这些特征和相似帧进行分割,然后从每个簇中选择与簇中心最接近的帧作为关键帧,该方法在 T - 使用预训练模型降低速率原则进行图像聚类
该研究提出了一种基于预训练模型的图像聚类方法 ——CLIP,并结合自我标注算法,取得较好效果。
- 通过样本排名提升图像聚类及其在遥感图像中的应用
本文提出了一种基于样本排名和加权交叉熵损失的图像聚类技术,其中样本排名基于密集邻域中样本所属当前聚类的可能性计算,该方法可以用于遥感图像。实验结果表明,该技术可以显著提高最先进的图像聚类模型的性能。
- ICCV深度关系度量学习
本文提出了一种深度关系度量学习(DRML)框架,用于图像聚类和检索。该方法采用可自适应学习的特征集合来建模类内和类间分布,并使用关系模块和图建模在图像上进行关系推理,得到一种关系感知嵌入来测量相似性,从而有效提高了当前深度度量学习方法的效果 - ICCV通过最大化多视角之间的互信息进行聚类
该研究提出了一种新颖的图像聚类框架,将联合表示学习和聚类相结合,并使用加权的对比损失函数来训练,在多个图像数据集上表现出显著的优越性。
- 自监督学习的均值漂移
本研究提出一种基于平均漂移算法的自监督学习方法,通过将相邻的图像进行平移并聚合来学习图像的特征表示,无需对图像进行反向对比或采用较多的先验知识。该方法在 ImageNet 数据集上的线性评估中实现了 72.4% 的准确率,优于 BYOL 方 - SPICE: 图像聚类的语义伪标记
本文提出了一种基于语义伪标签的图像聚类框架,使用两种语义感知的伪标签算法进行自监督学习来测量特征相似性和聚类差异,并成功将无监督分类与有监督分类之间的差距缩小,实现了图像聚类的新突破。
- 学习图像聚类嵌入:三元组损失方法实证研究
本文在嘈杂标签的假设下,使用 Triplet Loss 训练卷积神经网络学习能区分特征,并通过 K-means 和相关聚类评估三种 Triplet Loss 公式的聚类性能,提出一个新的公式优于现有方法,应用于 CIFAR-10 图像分类数 - 深度变换不变聚类
本研究基于深度学习,提出了新的图像聚类方法,通过学习图像变换并在图像空间直接进行聚类,并可以轻松处理聚类中的不变性,实现了对聚类中心和聚类分配的解释性。研究表明,该方法在标准图像聚类基准测试中具有极高的竞争性和前景性。
- GATCluster:自监督高斯注意力网络用于图像聚类
本文提出了 GATCluster,一种基于自监督高斯注意力网络的图像聚类方法,通过设计四个自学习任务,使用变换不变性、可分离最大化、熵分析、注意力映射等约束条件,学习到了具备目标导向的语义特征,并且采用参数化注意力模块和软注意力损失机制进行 - ICLR自动发现和学习新的视觉类别:基于排序统计学的方法
本文针对在一个图像集合中发现新类别的问题,提出结合自监督学习、排名统计和联合目标函数优化的方法,使用带标签和未标记数据训练数据表示模型,成功应用于标准分类基准测试中,显著优于现有的方法。
- ECCV高效率多视点二进制压缩用于可扩展图像聚类
本研究提出了一种名为 HSIC 的方法,它通过二进制压缩彻底超越了传统的图像聚类方法,可以有效地应对大规模多视角图像聚类问题,并成功减少了计算时间和内存占用。