- uaMix-MAE:基于无监督音频混合的高效预训练音频 Transformer 调优
提出了一种有效的 ID 调节策略 uaMix-MAE,通过对预训练的 MAEs 进行对比调节,以实现对特定任务的语义有效适应,并且通过操纵输入和虚拟标签空间中的音频样本来优化模型,实验结果表明在低 / 少样本设置中,所提出的模型在有限的无标 - 基于语境相关的邻域精炼在深度聚类中的应用
自我监督学习与深度聚类的实例区别视角启发了对语义相似实例分组的重要性,通过促进由邻域一致性保留的语义结构,通过在线重新排序过程,挖掘更有信息量的邻居,进而鼓励跨视图的邻域一致性,并通过渐进松弛的边界过滤策略缓解聚类边界附近的噪声。我们的方法 - 对比学习中互信息的严谨分析
对比学习通过互信息分析的深入研究,引入了三种新方法和一些相关定理,以增强互信息分析的严谨性,并通过重新评估对比学习分析的三个实例,展示了它们在加深理解或纠正误解方面的能力。
- 增强对比实例判别的语义正对组
本研究提出了一种基于语义正例对集合(SPPS)的方法,它可以降低在表示学习期间丢失重要特征的风险,并在 ImageNet,STL-10 和 CIFAR-10 数据集上验证了该方法的可行性。
- GraSS: 基于梯度引导采样策略的对比学习用于遥感图像语义分割
本研究提出了一种名为 GraSS 的基于自我监督对比学习的遥感图像语义分割方法,利用对比损失梯度中的区域信息和自适应选取策略,以构建新的正负样本,从而有效地提高了高分辨率遥感图像语义分割的性能。
- ICLR软化邻域:一种正对比视觉表示学习中的支持者
本文重新思考了对比学习方法中二元实例判别的不足之处,提出了基于相关实例(即软近邻)的对比学习方法(SNCLR),该方法有效地提高了 VIT 和 CNN 编码器中的特征表示,从图像分类、目标检测和实例分割三个标准视觉识别基准方面得到了验证。
- ECCVMoQuad: 视频对比学习的动态聚焦四元构建
本文介绍了一种名为 MoQuad 的方法,该方法采用了一种简单而有效的样本构建策略来提高视频对比学习中动作特征的学习效果,通过对正、负样本的外观和运动进行干扰,为每个视频实例创建四元组,使模型可以更好地利用运动信息。实验结果表明,在动作识别 - 自监督视觉表示学习的孪生图像建模
该研究提出了一种新的自监督学习方法 Siamese Image Modeling,它通过预测同一图像的不同视图的表示来达到语义对齐和空间敏感的目的,这种方法在 ImageNet 微调和线性探测、COCO 和 LVIS 检测以及 ADE20k - CAiD: 基于上下文感知的医学影像自监督学习实例鉴别
该研究提出了一种基于 Context-Aware instance Discrimination(CAiD)的简单有效自监督框架,用于从未标记的医学图像中提取更具区别性的特征。实验结果表明,CAiD 能够丰富已有的实例区别方法所学习的表征, - CVPR面向自监督对应学习的区域感知内外视频重构
利用 LIIR,一种局部感知的交叉和内部视频重建框架,填补了自监督一致性学习中的三个缺失部分,即实例区分、位置感知和空间紧凑性,从而学习视觉对应关系。
- Mugs:多层次自监督学习框架
本研究提出了一种名为 Mugs 的多粒度自监督学习框架,通过三种互补的粒度监督,明确学习多粒度的视觉特征。该框架在多项任务上超越了现有的最佳结果。
- 模型适应:无源数据对比学习的无监督域自适应
本研究提出了一种无监督模型自适应的历史对比学习技术,通过历史模型的假设来弥补源数据中的缺失,从而实现将源训练模型适应到目标分布的无监督域适应。实验结果表明,该方法在各种视觉任务和设置下一致优于现有技术。
- ICCV视频对应学习的联合时空图中的邻居关系建模
本研究提出了一种自监督学习方法,从未标记的视频中学习可靠的视觉对应关系。 所提出的方法将对应关系形式化为在联合空间 - 时间图中寻找路径的过程,并在此基础上利用循环一致性来识别图像中的动态对象,从而实现了中心 - 邻居对之间的潜在关联学习。 - ICCV无监督视觉表示学习中的时间知识一致性
本文提出了一种新的算法,名为 TKC,将时间一致性集成到现有的实例区分范例中,并且能够在 ResNet 和 AlexNet 上学习更好的视觉表示,在下游任务上也有良好的泛化效果。
- 对比学习能否避免捷径解决方案?
提出了一种名为隐式特征修改 (IFM) 的方法,以改进对比学习的特征提取,避免压抑重要的预测特征并提高视觉和医学成像任务的性能。
- 对比模型反演用于无数据知识蒸馏
本文提出对比模型反演(Contrastive Model Inversion)来对抗由现有反演方法所引起的数据多样性缺失问题,实现更高的数据多样性从而提高实例区分度及在知识蒸馏中的性能表现。
- ICCV从朋友那儿获取帮助:最近邻对比学习视觉表示
NNCLR 是一种基于最近邻对比学习的自监督学习算法,将数据集中最近邻作为正样本而不是图像的不同视角,能够提供比预定义的变换更多的语义变化,达到了在 ImageNet 分类和迁移学习基准测试中超越现有先进方法的效果。此外,该方法的鲁棒性能更 - CVPR针对无监督视频多物体分割的目标感知对象发现和关联
该研究提出了一种新颖的无监督视频多目标分割方法,通过结合前景区域估计和实例分组来提高实例判别,引入判别性外观模型用于目标跟踪,实现更准确的物体发现,以及采用自适应内存更新等三种策略提高分割准确性和推理速度,并在 DAVIS17 和 YouT - AAAI非任务相关知识构建的可传递广义零样本学习表示
该文提出了一种新的双对比嵌入网络(DCEN),通过语义对齐和实例区分同时学习特定任务和任务无关知识,其中实例区分监督可帮助捕捉视觉低级知识,减轻表示偏差,从而获得可传输的表示。
- 鲁棒音频视觉实例判别
本文介绍了一种自监督学习方法,以学习音频和视频表征,并通过行动识别任务的实验验证了其解决音频 - 视觉实例区别问题和提高迁移学习性能的贡献。