集群感知的相似度扩散用于实例检索

Jun, 2024

集群感知的相似度扩散用于实例检索

Cluster-Aware Similarity Diffusion for Instance Retrieval

Jifei Luo, Hantao Yao, Changsheng Xu

TL;DR我们提出了一种新颖的基于聚类感知相似性 (CAS) 扩散的实例检索方法，以减少来自其他流形的影响，并通过引入逆约束项和邻居引导相似性平滑方法来优化相似性矩阵，实验结果证明了提出的 CAS 的有效性。

Abstract

diffusion-based re-ranking is a common method used for retrieving instances by performing similarity propagation in a nearest neighbor graph

diffusion-based re-ranking similarity propagation nearest neighbor graph cluster-aware similarity (cas)instance retrieval

发现论文，激发创造

通过快速传播聚类相似性增强集成聚类

本文提出了一种新颖的基于随机游走的集成聚类方法，通过快速传播集群间相似性解决了现有算法所面临的对象级别信息和多尺度间接联系隐藏等方面的挑战，并提出了两个新的一致性函数以获得一致聚类结果。

Oct, 2018

在线和离线处理分离扩散实现高效图像检索

提出了一种新的扩散技术，将扩散结果预先计算并应用于数据库中的每个元素，以优化在线搜索性能，并采用 late truncation 方法改善检索效果。

Nov, 2018

基于语境相关的邻域精炼在深度聚类中的应用

自我监督学习与深度聚类的实例区别视角启发了对语义相似实例分组的重要性，通过促进由邻域一致性保留的语义结构，通过在线重新排序过程，挖掘更有信息量的邻居，进而鼓励跨视图的邻域一致性，并通过渐进松弛的边界过滤策略缓解聚类边界附近的噪声。我们的方法可以轻松整合到通用的自我监督框架中，并在几个常见基准测试中优于现有方法。

Dec, 2023

数据聚类的判别相似度

本文提出了一种名称为 CDS 的新的聚类方法，其使用学习出的判别式相似度对数据集进行无监督聚类，并通过 Rademacher 复杂度对其进行了一般化分析。同时，使用核密度分类的积分平方误差界也可以导出所得到的判别相似度。在使用核函数作为相似度函数的情况下，使用 CDS 聚类方法的有效性已通过实验结果得到证明。

Sep, 2021

深度聚类中的扩散采样和硬度感知自蒸馏

本文提出了一种新颖的端到端深度聚类方法，采用了扩散采样和硬度感知自蒸馏策略（HaDis），通过扩散采样对实例进行对齐以提高簇内紧密度，引入硬度感知自蒸馏机制来提高样本权重的自适应调整能力，同时结合原型对比学习来增强簇间可分性和簇内紧密度，实验证明了 HaDis 方法在五个挑战性图像数据集上相比现有技术具有更优的聚类性能。

Jan, 2024

熵感知的相似度用于平衡聚类：以黑素瘤检测为例

本文提出了一种新的基于 entropy-aware similarity 的方法用于 balanced clustering, 通过将熵纳入一个新的相似度公式中，将不平衡的数据进行互补聚类来最大化平衡度，实现成功聚类和患者黑色素瘤的识别。

May, 2023

DeDrift：内容漂移下的鲁棒相似度搜索

通过研究媒体共享网站上上传和搜索的内容的统计分布，我们调查了 “内容漂移” 对基于嵌入空间中最近邻搜索的大规模相似度搜索工具的影响。我们提出并分析了基于可用长时间段上的时间信息的真实图像和视频数据集，基于这些学习结果，我们设计了一种名为 DeDrift 的方法，它通过实时更新嵌入量化器来持续调整大规模索引结构，几乎消除了由查询和数据库内容漂移导致的准确度降低，而且比完全索引重建快 100 倍。

Aug, 2023

相似性搜索的快速谱排序

本研究介绍了一种显式嵌入方法，将流形搜索转化为欧氏距离搜索，并且利用近似傅里叶基础加速在线搜索，从而提高了特定对象的检索精度和效率。

Mar, 2017

置换聚类分配的对抗性对比学习

本文提出一种名为 SwARo 的对抗性对比学习框架，结合聚类分配和实例感知对抗样本生成以提高语义相似性和计算效率，并在多个基准数据集上进行评估，获得了与最先进的基线相比的一致改进。

Apr, 2022

基于扩散模型的协同过滤：揭示高阶连接的潜力

通过提出 CF-Diff 方法，结合扩展的协作标志、多跳邻居以及交叉注意力引导的多跳自动编码器（CAM-AE），克服了现有扩散模型推荐系统在准确推荐方面无法明确利用包含关键协作信号的高阶连接问题。实验证明，CF-Diff 在三个真实世界数据集上优于基准推荐方法，相对最佳竞争对手的表现可达到 7.29％的显著增益，并确保了计算效率与用户或物品数量呈线性比例。

Apr, 2024