- CVPRUniUD-FBK-UB-UniBZ 提交至 EPIC-Kitchens-100 多示例检索挑战赛 2022
该研究报告介绍了我们参加 EPIC-Kitchens-100 多实例检索挑战赛的技术细节,我们设计了一个结合不同模型并采用最近开发的基于关联增强的三元组损失训练的方案。我们的参赛作品在公共排行榜上表现良好,取得了平均得分 61.02% nD - 对抗对比自监督学习
本文介绍了一种基于在线负样本对挖掘的自我监督深度学习范式,包括学生教师网络、正负样本对挖掘和三元组式的损失函数等,实验表明该方法可以有效地提高标签效率并在 ILSVRC-2012 上表现优异。
- 度量学习的经验适用于图像字幕检索吗?
在基于图像标题检索的任务中,三元组损失与半硬负例已成为从头开始优化的方法的事实选择。最近度量学习的进展已经产生了比三元组损失在图像检索和特征表示等任务上效果更好的损失函数。本文通过比较两种基于图像标题检索方法上的三种损失函数来回答这个问题, - 一张图片相当于五个句子吗?对于图像 - 文本匹配的语义进行新的探究
本文提出了两种关联度度量指标,并提出一种新的策略用于定义语义自适应边缘,并将其用于标准三元组损失函数的优化中,从而在有限的训练数据情况下得到了很大的改进。
- MM解决零样本学习语义与视觉混淆问题
本文提出了一种利用多模态信息搜索解缠表示空间的多模态三元组损失模型(MMTL),并且发展了一种名为 “解开类表示生成对抗网络(DCR-GAN)” 的新型模型,该模型能够在训练、特征合成和最终识别阶段利用解开表示,从而使得 DCR-GAN 能 - 关于在图像检索中质心的不合理有效性
本文提出了在训练和检索中使用平均质心表示法的图像检索方法。通过对类的单个嵌入进行聚合表示类,无论在嵌入稳定性还是检索速度上都有出色的表现。在两个数据集上的实验表明,该方法在时尚检索和 ReID 应用中具有优越性。
- WWW自适应度量学习的研究
本文提出了一种新的自适应度量学习框架,其通过基于 ANN 的度量学习来自适应地学习模型复杂度,并且通过自适应约束的流来进行学习,并通过 Adaptive-Bound Triplet Loss(ABTL)利用输入的约束,通过 Adaptive - NPT-Loss:一种具有内隐挖掘功能的度量损失用于人脸识别
本文提出了一种基于 triplet loss 和 proxy 的新型损失函数来实现各个身份特征之间的最小可分性,该函数简单易实现且在高分辨率和低分辨率人脸识别任务中均可达到 SOTA 的性能表现。
- 使用实体感知的上下文嵌入进行事件驱动新闻流聚类
提出一种基于非参数流式 K 均值算法的在线新闻流聚类方法,使用了稀疏和密集文档表示的组合,采用神经分类器做聚类决策,并将文档 - 聚类相似度聚合在这些多重表示中。使用三元组损失将加权文档 - 聚类相似度模型转化为线性分类目标,同时使用 Tr - 使用三元组损失学习关键词检测的有效表示
本文介绍一种利用三元组损失和变种 kNN 方法,以及基于音韵相似性的三元组挖掘方法相结合的表示学习技术,显著提高卷积网络的分类准确率,特别在语音识别领域中。作者还在 Google 语音命令数据集 V1 和 V2 中刷新最佳 SOTA 并超过 - 基于熵的不确定性校准用于广义零样本学习
提出一种新的框架,利用双重变分自编码器和三元组损失学习区分性潜在特征,并应用基于熵的校准来最小化见和未见类之间重叠区域的不确定性,在六个基准数据集上进行的实验表明,该方法胜过现有的最先进方法。
- AAAIR$^2$-Net:面向句子语义匹配的关系双重学习网络
本研究提出了一种基于深度神经网络的 R2-Net 方法用于句子语义匹配问题,该方法利用 BERT 自动编码句子,设计了一个 CNN 编码器来捕获局部信息,并引入了一种自监督的关系分类任务来引导模型更好地提取关系信息,同时利用三元损失函数更好 - 对抗自监督场景流估计
本文提出一个基于度量学习的自监督场景流估计方法,包括多尺度三元损失和周期一致性损失,使用提出的基准测试 Scene Flow Sandbox 显著提高了自监督场景流估计的性能。
- 超越三元组损失:利用细粒度差异感知成对损失进行人员再辨识
本文提出了一种新的用于人物 Re-IDentification 的对比损失函数,因为大多数现有方法采用三元组损失函数难以捕捉细节的外貌差异,该损失函数通过对图片间差异的指数级和有界级进行自适应惩罚,能够较大幅度地提高模型在四个基准数据集上的 - WWW面部篡改的深度检测
本文提出了一种基于深度学习的人脸操作检测方法,包括特征提取和二进制分类两个阶段,并采用三元组损失函数来更好地区分真实面孔和伪造面孔,实验结果表明该方法的性能大多数情况下优于现有技术。
- 可见光热像人物再识别中的参数共享探索和基于异质中心的三元组损失
本文提出了针对 VT Re-ID 任务的一种基于两流网络的可见 - 热交叉模态人员重新识别方法,探索了参数共享对该任务的影响,并通过提出异中心三元组损失函数进一步提升了识别效果。实验证明,该方法在两个数据集上的表现显著优于已有方法,成为 V - ECCV基于转化注意力一致性和对比聚类损失的无监督深度度量学习
该研究提出了一种基于变换后的注意力图的无监督深度度量学习方法,通过学习图像在比较中产生的视觉注意图的一致性,使用孪生深度神经网络对图像及其变化或匹配对进行编码和比较,并采用三元损失和对比聚类损失来增强生成特征的跨类别差别能力,实验结果表明该 - ECCV难负例虽难,但有用
本文主要研究了三元组损失的应用,通过对三元组的空间特征进行特征分析,发现选择最难的负样本会导致失败的训练行为。为此,提出了简单的修复方法来优化损失函数,展示了使用硬负样本进行优化会产生更具可推广性的特征,从而在高内类差异数据集的图像检索结果 - 学习图像聚类嵌入:三元组损失方法实证研究
本文在嘈杂标签的假设下,使用 Triplet Loss 训练卷积神经网络学习能区分特征,并通过 K-means 和相关聚类评估三种 Triplet Loss 公式的聚类性能,提出一个新的公式优于现有方法,应用于 CIFAR-10 图像分类数 - 超越三元损失函数:用于人员再识别的元原型 N 元损失函数
本文提出了一种多类别分类损失函数(N 元损失),旨在联合考虑多个实例进行查询优化,以实现更好的 Person Re-identification 测试 / 推理过程和更高的性能。