- IJCAI自适应加权对抗领域适应
提出了一种自适应的、基于条件分布的加权对抗领域适应方法,将三元损失与对抗损失结合应用于度量学习,以保证类别级别的对齐;实验结果表明,该方法在标准领域适应数据集上优于现有方法。
- AVGZSLNet: 多模嵌入重构标签特征的音视频广义零样本学习
本文提出了一种新的多模式推广零样本学习方法,使用文本嵌入的语义相关性将音频和视频嵌入与相应类别标签文本特征空间对齐,使用交叉模态解码器和组合三元组损失,在多模态设置中来执行零样本学习,实验证明该方法在各种模态下的推广零样本分类和检索任务中都 - HDD-Net:混合检测器描述符和相互交互学习
本研究提出了一种局部特征提取的方法,将检测器和描述子两个步骤互相独立,并关注它们在学习过程中的交互。该方法使用了一种新型的检测器优化技术和多尺度方法提取图像的局部特征,并在各项基准测试中显示出了比现有技术更好的性能。
- SL-DML: 用于多模式单次动作识别的信号水平深度指标学习
使用度量学习方法,将我们提出的一种基于信号级别的解决方案编码成图像并提取特征,通过三元组损失学习特征嵌入,进而在嵌入空间的最近邻搜索中解决行为识别问题,并在 NTU RGB + D 120 数据集上取得了比基准方法更好的性能,还能够很好地泛 - ECCV适应性离线五元组损失用于图像文本匹配
本文介绍使用离线采样负样本与五元组损失函数来改进图像和文本匹配模型,并在 MS-COCO 和 Flickr30K 数据集上得到了显著的性能提升。
- Circle Loss:一种统一的对偶相似性优化视角
本文提供了一个对深度特征学习进行相似性优化的观点,介绍了一种更灵活的 Circle 损失函数,并且在人脸识别、人员重新识别以及一些细粒度图像检索数据集上展示了 Circle 损失的卓越性能。
- 自监督学习用于音视频发言人分离
提出自监督的音视频同步学习方法,通过引入动态三元组损失和多项式损失函数来解决说话人分离问题,结果表明该方法在人机交互系统中大幅提高了 F1 分数和降低了分离误差率,并且介绍了一个新的大规模中文音视频语料库。
- ECCVSOLAR:用于图像检索的二阶损失与注意力
本研究探索了深度学习中的两个二阶组件,一个关注于空间信息以增强图像描述符表现,另一个则关注于二阶相似性损失用于图像检索,两者相结合在图像检索、匹配任务中取得了最先进的结果。
- 使用深度三元组嵌入的个性化活动识别
本研究探讨了基于全卷积神经网络的个性化活动识别方法,通过个人三元组深度嵌入,并与基线方法等进行了比较,结果表明三元组损失提供了最佳性能。
- ICLR互信均授:基于伪标签精炼的无监督领域自适应人员再识别
该研究提出一种无监督的 Mutual Mean-Teaching (MMT) 框架,通过软标签精炼与三元组损失优化联合训练,从而在 Person Re-Identification 中实现了更好的特征表示与优秀的 unsupervised - 再次捍卫三元组损失:利用快速近似三元组损失和标签精华学习鲁棒的人物再辨识
提出了一种快速逼近的三元组损失(FAT)来匹配人物重新识别任务的大规模数据集中的潜在噪声标签,同时提出了标签蒸馏策略来改进由于潜在噪声标签的学习,结果表明该方法可显著提高 ReID 特征的准确性,效率,鲁棒性和直接可迁移性。
- 三维点云分类的转导式零样本学习
本文将零样本学习扩展到三维点云分类领域,提出基于三元组损失的方法,并在实验中证明了其在三维点云和二维图像分类任务中的有效性。
- 跨模式食谱检索的分治策略:从最近邻基线到最佳表现
我们提出了一种新颖的非参数方法,用于跨模式菜谱检索,结合图像和文本嵌入,通过将我们的方法与用自监督分类目标独立训练的标准方法相结合,我们创建了一个基准模型,在挑战性的图像到菜谱任务上优于大多数现有方法。我们还使用我们的方法比较使用不同现代方 - 使用音乐启发的嵌入实现准确可扩展的版本识别
本文提出了一种名为 MOVE 的方法来进行音乐版本鉴别,该方法利用三元组损失和硬三元组挖掘策略学习可伸缩嵌入,采用了另一种输入表示方法,并引入了一种新的时间内容概述技术、标准化的潜在空间和专门为版本鉴别设计的数据扩增策略,并在两个公开基准数 - SIGIR提高协同度量学习效率的负样本采样优化
本文提出了一种针对距离度量学习的负采样策略,在推荐方面获得了不错的准确度和普及性偏差表现。该策略使得 CML 模型即使在批处理大小比默认采样策略需要的批处理大小小一个数量级的情况下,仍然能够高效地工作。
- MM基于三元组嵌入距离和相似度学习的音频无关语音说话人验证
本文介绍了两种在培训阶段优化说话人嵌入的方法:使用三元组损失来优化嵌入之间的欧几里德距离并减少多类交叉熵损失,以及设计一种嵌入相似度测量网络来控制选定嵌入之间的相似度。将两个新方法与原始网络联合培训,实现了最先进的结果,对 2016 年 N - CVPR使用深度时间外观匹配联合进行在线多行人跟踪
本研究提出了一种基于联合推理网络的轨迹外观模型,有效解决了在多目标跟踪中应对高维度外观信息的问题,且在识别目标与观测匹配以及保持目标的一致性方面具有重要贡献。
- 采用平滑深度度量学习的大规模问题改写检索
本文旨在提出一种基于神经网络句子编码器和近似 k 最近邻索引的新型 QPR 系统来理解和回答广泛应用于社区问答和开放领域口语问答系统中的稀有和嘈杂的问题再述形式,并通过远程监督从问答日志自动产生一份问题近义复述检索试验的注释数据集;在两个 - 通过三元损失的对抗训练提高深度神经网络的鲁棒性
本文提出了一种名为 Adversarial Training with Triplet Loss 的算法,通过利用距离度量学习技术中的 Triplet Loss 方法,提高了深度神经网络的鲁棒性,并在此基础上提出了一个集合版本的算法,可以取 - ICML深度人脸识别的三元组蒸馏
本文提出了一种增强版本的三元组损失函数,名为三元组蒸馏,在多个数据集上展示了其优于原始三元组损失函数的优越性,能够自适应地变化正负样本之间的间隔,从而更好地利用相似性信息来提高紧凑模型的性能。