利用 LIIR,一种局部感知的交叉和内部视频重建框架,填补了自监督一致性学习中的三个缺失部分,即实例区分、位置感知和空间紧凑性,从而学习视觉对应关系。
Mar, 2022
本文提出了一种利用自我监督方式从视频中学习可靠密集对应关系的方法,通过跟踪大规模图像区域和建立连续视频帧之间的像素级细粒度关联来实现。该方法利用共享的帧内亲和矩阵来建模两个任务之间的协同作用,在区域级别和像素级别同时建模视频帧之间的转换,从而在视觉对应任务中实现了优异的表现。
Sep, 2019
本文研究了自监督表示学习的核心方法之一 —— 图像内部不变性学习,提出了一种新的基于循环一致性的对比学习方法,探索了跨视频关系,实现了图像表示的有效学习,并在多个下游任务中获得了显著的改进。
May, 2021
本文提出了一种适用于匹配视频中对应点的特征嵌入的自监督学习方法,其中使用自然的时空一致性训练指针模型,并通过引入信息瓶颈和循环模型等方式来解决跟踪器漂移等挑战,最终取得了在视频分割和关键点跟踪上的最佳效果。
May, 2019
我们提出了一种协作版对比学习方法,利用数据驱动的采样来利用多个输入视频视图之间的隐式关系,以应对该问题,并在动作识别这一下游任务上取得了竞争性能表现。
Apr, 2021
文章介绍了一种利用自监督学习的图形结构来学习具有不变性特征的视觉表示,并应用该表示在不同的识别任务中取得了显著性能提升。
Aug, 2017
本文提出了一种基于自我监督学习的视频特征表示方法,在传统自我监督学习的基础上通过引入内部负样本来扩展负样本集,从而使单个视频更加充分地表达时空信息,并能够有效地提高视频检索和识别的性能。
Aug, 2020
本文提出了一种空间 - 时间自我监督学习方法,通过对无标注图像的对比学习来提取空间特征,并通过重构学习利用无标注视频中的时间线索增强特征,以在视频分析任务上取得比现有自我监督方法更好的表现,并进行了削减研究以验证两步设计以及蒸馏损失的有效性。
Sep, 2022
通过开发一个统一的框架,其中同时建模跨帧密集对应以进行本地区分特征学习并嵌入对象级上下文进行目标掩码解码,从而使得能够直接从未标记的视频中学习执行基于掩码的连续分割,而不是依赖于基于像素的关联的廉价 “复制” 标签的非直接方法。
Mar, 2023
通过使用 Video-Induced Visual Invariances (VIVI) 的自监督学习框架,本文提出了一种可以在 19 种视觉任务中实现超过最佳监督模型的自监督转移学习方法。
Dec, 2019