基于排名的实例选择的抗噪深度度量学习

CVPRMar, 2021

基于排名的实例选择的抗噪深度度量学习

Noise-resistant Deep Metric Learning with Ranking-based Instance Selection

Chang Liu, Han Yu, Boyang Li, Zhiqi Shen, Zhanning Gao...

TL;DR该研究提出了一种名为 PRISM 的深度度量学习的抗噪声训练技术，它使用记忆库存储和检索图像特征，并使用平均相似度来识别噪声数据，从而取得了比 12 种现有方法更优异的性能，最高可达 6.06% 的 Precision@1。

Abstract

The existence of noisy labels in real-world data negatively impacts the performance of deep learning models. Although much research effort has been devoted to improving robustness to noisy labels in classificatio

noisy labels deep metric learning noise-resistant training prism image features

发现论文，激发创造

图像胜过言辞：从因果中介视角理解和减轻视觉语言模型中的偏见

通过因果中介分析，我们提出了一个框架，来测量和映射在视觉 - 语言模型中生成和传播偏见的路径，结果显示图像特征是偏见的主要贡献者，对模型偏见的减轻起到重要作用，同时能保持性能稳定。

Jul, 2024

基于编码率度量的深度度量学习抗塌陷损失

我们提出了一种名为反崩溃损失函数的新方法，该方法通过最大化样本特征或类别代理的平均编码率来提高嵌入空间中特征聚类的稀疏性，以防止特征崩溃并促进模型的泛化性能。与现有的前沿方法相比，我们的方法在基准数据集上进行的综合实验表明，其表现优于现有的最先进方法。大量实验还验证了我们的方法在防止嵌入空间崩溃和促进泛化性能方面的有效性。

Jul, 2024

多阈值深度度量学习的面部表情识别

利用多阈值深度度量学习技术，通过提取不同阈值下的表情特征表示，可以大幅提高面部表情识别准确性。通过将嵌入层划分为一组切片，并采用多阈值深度度量学习算法，每个切片对应一个样本阈值，并通过对应的三元组损失进行学习，从而获得一组独特的表情特征，从而增强面部表情识别的准确性。在多个表情数据集上进行的实验评估显示了该方法的优越性能。

Jun, 2024

使用软标签的合成样本减轻噪声监督

通过使用混合模型从局部损失分布学习样本权重，我们提出了一种利用合成样本训练模型的框架来减轻噪音标签影响，并通过逐渐修正噪音标签估计软目标，得到了更为准确的近似真实标签和更加独立和清晰界定的聚类，实验证明我们的方法在两个基准数据集 (CIFAR-10 和 CIFAR-100) 及两个大规模真实世界数据集 (Clothing1M 和 Webvision) 上优于现有技术方法且具备可靠的学习表达能力。

Jun, 2024

跨领域可变形图像对齐的编码匹配准则

我们提出了一种基于深度学习的注册方法，旨在解决不同域中的可变形注册问题。通过设计一个注册专用的编码器，模拟了图像特征和结构特征的匹配准则，有助于提高注册准确性和适应性，并通过单次学习更新编码器以适应不同域。

Jun, 2024

用预测的难样本标签重新训练可证明提高模型准确性

通过理论分析，在给定随机受损标签的线性可分情境中，重新训练可以提高模型的整体准确率，并且通过基于共识的重新训练方法在没有额外的隐私成本的情况下显著提高标签差分隐私训练的准确率。

Jun, 2024

深度度量学习驱动的遥感图像检索的标注成本高效主动学习

通过结合度量学习、主动学习以及不确定性估计等方法，提出了一种用于远程感知图像检索的低成本主动学习方法，该方法有效地减少了图像标注的成本，并在两个远程感知基准数据集上取得了显著的实验结果。

Jun, 2024

重新思考图分类中噪声标签的影响：从实用性和隐私角度的观察

基于消息传递机制的图神经网络在图分类任务中取得了先进的结果，然而，在训练数据中存在噪声标签时，它们的泛化性能会下降。本文从数据隐私和模型效用的角度来衡量噪声标签对图分类的影响，发现噪声标签会降低模型的泛化性能，并增强对图数据隐私的成员推理攻击能力。因此，我们提出了一种针对有噪声标签的图分类的鲁棒图神经网络方法。该方法通过高置信度样本和每个类别的第一个特征主成分向量精确过滤噪声样本，然后利用鲁棒主成分向量和数据增强下的模型输出来指导双重空间信息引导的噪声标签校正。最后，引入监督图对比学习来增强模型的嵌入质量并保护训练图数据的隐私。通过在八个真实图分类数据集上比较十二种不同方法，验证了所提方法的效用和隐私性，与最先进的方法相比，在 30% 的噪声标签比率下，RGLC 方法分别实现了最大 7.8% 和最小 0.8% 的性能提升，并将隐私攻击的准确率降低到 60% 以下。

Jun, 2024

通过文本在 ViTs 中分解和解释图像表示超越 CLIP

我们提出了一个通用框架，能够识别不同模型部件在视觉转换器（ViTs）中的作用，并通过文本解释。应用于多种 ViT 变种，获得不同组件在特定图像特征方面的作用，以促进图像检索、可视化令牌重要性热图和减轻错误相关性等应用。

Jun, 2024

了解您的邻里：由通话图查找驱动的一般性和零射能力的二进制函数搜索

提出了一种基于图神经网络的二进制代码相似性检测方法，采用了一种新颖的图数据表示方法 —— 调用图集，通过一系列统计特征来编码二进制可执行文件中每个函数周围的邻域，从而捕捉局部和全局上下文。设计了专门的图神经网络模型，学习将图表示映射为编码了语义代码相似性的特征向量。实验结果表明，与基准技术相比，调用图集和新颖的图神经网络架构的结合在跨架构、单架构和零样本任务上取得了最先进的性能。此外，该方法在针对域外函数内联任务进行评估时也表现出色。总体而言，该研究提供了一种通用且有效的基于图神经网络的二进制代码相似性检测解决方案。

Jun, 2024