集群感知的相似度扩散用于实例检索
本文提出了一种新颖的基于随机游走的集成聚类方法,通过快速传播集群间相似性解决了现有算法所面临的对象级别信息和多尺度间接联系隐藏等方面的挑战,并提出了两个新的一致性函数以获得一致聚类结果。
Oct, 2018
提出了一种新的扩散技术,将扩散结果预先计算并应用于数据库中的每个元素,以优化在线搜索性能,并采用 late truncation 方法改善检索效果。
Nov, 2018
自我监督学习与深度聚类的实例区别视角启发了对语义相似实例分组的重要性,通过促进由邻域一致性保留的语义结构,通过在线重新排序过程,挖掘更有信息量的邻居,进而鼓励跨视图的邻域一致性,并通过渐进松弛的边界过滤策略缓解聚类边界附近的噪声。我们的方法可以轻松整合到通用的自我监督框架中,并在几个常见基准测试中优于现有方法。
Dec, 2023
本文提出了一种名称为 CDS 的新的聚类方法,其使用学习出的判别式相似度对数据集进行无监督聚类,并通过 Rademacher 复杂度对其进行了一般化分析。同时,使用核密度分类的积分平方误差界也可以导出所得到的判别相似度。在使用核函数作为相似度函数的情况下,使用 CDS 聚类方法的有效性已通过实验结果得到证明。
Sep, 2021
本文提出了一种新颖的端到端深度聚类方法,采用了扩散采样和硬度感知自蒸馏策略(HaDis),通过扩散采样对实例进行对齐以提高簇内紧密度,引入硬度感知自蒸馏机制来提高样本权重的自适应调整能力,同时结合原型对比学习来增强簇间可分性和簇内紧密度,实验证明了 HaDis 方法在五个挑战性图像数据集上相比现有技术具有更优的聚类性能。
Jan, 2024
本文提出了一种新的基于 entropy-aware similarity 的方法用于 balanced clustering, 通过将熵纳入一个新的相似度公式中,将不平衡的数据进行互补聚类来最大化平衡度,实现成功聚类和患者黑色素瘤的识别。
May, 2023
通过研究媒体共享网站上上传和搜索的内容的统计分布,我们调查了 “内容漂移” 对基于嵌入空间中最近邻搜索的大规模相似度搜索工具的影响。我们提出并分析了基于可用长时间段上的时间信息的真实图像和视频数据集,基于这些学习结果,我们设计了一种名为 DeDrift 的方法,它通过实时更新嵌入量化器来持续调整大规模索引结构,几乎消除了由查询和数据库内容漂移导致的准确度降低,而且比完全索引重建快 100 倍。
Aug, 2023
本文提出一种名为 SwARo 的对抗性对比学习框架,结合聚类分配和实例感知对抗样本生成以提高语义相似性和计算效率,并在多个基准数据集上进行评估,获得了与最先进的基线相比的一致改进。
Apr, 2022
通过提出 CF-Diff 方法,结合扩展的协作标志、多跳邻居以及交叉注意力引导的多跳自动编码器(CAM-AE),克服了现有扩散模型推荐系统在准确推荐方面无法明确利用包含关键协作信号的高阶连接问题。实验证明,CF-Diff 在三个真实世界数据集上优于基准推荐方法,相对最佳竞争对手的表现可达到 7.29%的显著增益,并确保了计算效率与用户或物品数量呈线性比例。
Apr, 2024