- ECCV类别对于上下文和反之亦然具有不变性:关于学习不变性以实现超出分布的泛化
该研究旨在提高 Out-Of-Distribution generalization 技术的表现,通过协调样本内的相似性来平衡环境数据的重要性,实现了一种简单有效的分类器,达到了最先进的状态。
- ECCVMemSAC: 大规模域自适应的记忆增强样本一致性
本文提出了一种名为 MemSAC 的方法,通过利用源域和目标域之间的样本级别相似性实现了判别式转移,并且通过适当的架构,可以处理大量类别的数据,验证表明它在诸如 DomainNet 和 Caltech-UCSD birds 等适用于大规模适 - 多模态情感识别中基于模态对无监督对比损失的方法
本文提出了一种基于无监督特征学习且包括对比损失的多模式情感识别方法,该方法可以减少资料标注费用、提高精确度并且无需大批量样本。相关实验数据表明,本方法比许多基线方法和无监督学习方法在多模式情感识别上表现更好,甚至超越了当前某些有监督方法的表 - 基于语言的音频检索:收敛绑定层和对比损失
本文介绍了一种简单,可扩展的架构,将语音和文本编码器结合在一起,并使用对比损失来显著提高基线模型的性能。通过使用预训练模型,无需微调即可在极低的训练内存要求下实现优异的语音检索表现。实验结果表明,采用我们的方法组合可以显著提高基线分数。
- LIMoE 模型在多模态对比学习中的应用:语言 - 图像专家混合
提出了一种用于多模态学习的稀疏专家模型 LIMoE,该模型接受图像和文本,使用对比损失进行训练,并提出一种熵基准的正则化方案。LIMoE 在多个尺度上展示出优异的性能,并能够实现零样本 ImageNet 准确度的显著提高。
- 有限标注条件下的分割学习:MRI 自监督预训练中的回归和对比损失
本文研究了两种预训练方法(回归损失和对比损失)对深度学习模型在磁共振成像下的肝脏分割和前列腺分割应用中的效果,并发现自我监督预训练减少了标记数据的需求,且基于对比损失的预训练的初始化效果更好。
- 用于高效超分辨率的残差局部特征网络
本文提出了一种新的残差本地特征网络 (RLFN) 方法,通过使用三个卷积层进行残差本地特征学习来简化特征聚合,同时伴随着改进的对比损失和训练策略,该方法在保持 SR 的 PSNR 和 SSIM 的同时显著优于所有最先进的高效图像 SR 模型 - 视频与语言联系定位的多级对齐训练方案
本文着眼于视频和语言之间的语义联系,提出了一种多级对齐训练方案,基于信息相似性从高层次的上下文到细粒度的语义,通过对称损失来对齐视频和语言的编码,从而在共享特征空间中确保相似信息紧密编码而不同语义的信息保持分开。我们的多级对齐训练可应用于各 - 用于推特健康提及分类的多种语言模型训练的新方法
本文提出了一种新的方法,使用对抗训练和对几个级别的 transformer 模型中的推文示例的表示进行高斯噪声扰动生成对抗性示例来训练语言模型,以进行卫生提及分类。添加噪声到较早的层有助于提高模型性能,而添加中间层的噪声会降低模型性能。最后 - ACLMuCoT: 低资源语言中的多语言对比训练问答
本文提出一种用于低资源语言的提高问答技术的方法,即通过翻译和转写将问题回答样本扩充到目标语言,利用增广数据微调已经在英语中预训练的 mBERT 问答模型,并引入对翻译问题上下文特征对之间的对比损失来提高不同语言家族的翻译准确性。
- 面向在线领域自适应目标检测
本研究提出了一种适用于目标检测的新型统一自适应框架,可以在线适应和改进目标领域的泛化能力,并使用 MemXformer 作为记忆模块和对比损失来增强目标特定的表示学习。
- WavFT: 利用标记和未标记数据微调声学模型
本文介绍了一种使用无标签数据的有监督语音模型微调方法,达到了分类和上下文特征学习相结合的效果,并使用对比损失来学习音频表示,进而在古吉拉特语和孟加拉语上分别减少了 11.2% 和 9.19% 的错误率。
- ICLRSimSiam 如何在无负样本的情况下避免崩溃?自监督对比学习的统一理解
本研究通过对最近提出的简约 Siamese (SimSiam) 方法的研究,使用矢量分解技术分析了 $l_2$-normalized 表示向量的梯度,提供了负样本和 SimSiam 避免崩溃的统一视角.
- CVPR基于实例关系图的无源域自适应目标检测
本文提出了一种在无需访问源数据的条件下,采用对比损失和实例关系图来增强目标表示并将源训练的物体探测器适应于目标域的训练策略;通过多个实验数据集证明,该方法优于先前的最先进的领域自适应检测方法。
- 利用对抗性对比训练提高推文健康提及分类
该论文利用对抗性训练和对比损失提高了医疗提及分类的性能,并通过解释性人工智能对结果进行分析。
- 基于插值的对比学习用于少标签半监督学习
提出了一种基于插值方法的半监督学习算法来解决使用一些标签的数据集时一致性正则化方法的性能问题,并设计了一种新型对比损失来引导学习网络嵌入样本,实现更好的边界决策能力,通过实验证明,与现有算法相比,该算法可提高分类准确率 5.3% 以上。
- 通过对比损失增强的批量关注,半监督地识别并描述新事件类型
本文提出了一种新的半监督事件类型归纳方法,使用掩蔽对比损失学习事件提及之间的相似性以及通过近似数据中的底层流形来解离已发现的群集,从而实现事件类型归纳和 FrameNet 帧的链接。
- ICLR学习图像检索的超级特征
本文介绍了一种基于超级特征的深度图像检索架构,只需要图像标签即可训练。超级特征由迭代的注意模块构建,通过对 Super-features 实施对比损失来匹配图像。与局部特征相比,这种方法在存储空间方面具有显着优势,并在常见地标检索基准上表现 - CVPR一种视觉语言式的通用人脸表征学习方法
本研究提出了一种通用的人脸表示学习框架(FaRL),其使用对比损失和掩蔽图像建模来同时掌握高层语义和低层信息。在大量的图像和文本对上进行预训练并在多个下游任务中验证其性能,在人脸解析和人脸对齐等人脸分析任务中展现了比以往预训练模型更好的迁移 - SurfEmb: 使用学习表面嵌入的密集连续对应分布进行物体姿态估计
该研究提出了一种使用无先验知识的数据学习物体表面上密集、连续的二维 - 三维对应分布的方法,并使用新方法进行刚性物体的六维姿态估计,该方法使用学习到的分布来采样、评分和改进姿势假设。