- CVPR基于时间对比学习的半监督动作识别
通过利用不同视频播放速度下不改变动作的特性,利用未标记的视频,学习两通道时间对比模型,提取时间信息并在多个基准数据集和网络架构上实现优异的半监督图像识别效果。
- CVPRVisualVoice: 跨模态一致性的音视频语音分离
提出一种基于面部出现和声音特征对语音进行分离的方法,可对五种基准数据集进行音视频语音分离和增强,而且具有较好的泛化性能。
- 预测未来的可预测性学习
该论文提出了一个基于超伯利几何的预测模型,能够从未标记的视频中学习可预测特征的层次结构,并在动作预测方面展现出层次表示法的关键作用。
- 符号回归:从失真视频中发现物理定律
提出了一种用于无监督学习运动方程的方法,包括用 Pareto 最优符号回归找出描述运动的微分方程,以及使用主成分分析从潜在空间中移除额外的维度,从而重新发现未标记移动对象的笛卡尔坐标。
- ECCV发出声音的物体
本文提出了一种利用未标记视频进行跨模态自监督学习的网络架构,实现音频和视觉之间的信息检索和图像中声音对象的准确定位,同时探究了基于 AVC 任务的网络架构设计方法,并与此相关的数据准备问题进行了讨论。
- NIPS生成具有场景动态的视频
利用大量未标记的视频来学习场景动态的模型,提出了一种具有时空卷积结构的生成对抗网络来生成视频,该模型能够更好地预测静态图像的合理未来,并且能够识别动作的有用特征,这表明场景动态是表示学习的一个有前途的信号。
- CVPR缓慢而稳定的特征分析:视频中的高阶时间相干性
本文提出了 “稳态特征分析” 这一新的方法,通过在未标记的序列视频中训练卷积神经网络,利用各种数据集证明本方法在目标、场景和动作识别等方面的有效性,且其特征甚至可以超过传统的监督式预训练方法。
- CVPR从未标注的视频预测视觉表达
该论文提出了一种利用未标记视频进行计算机视觉的动作和物体预测的深度学习框架,并采用可预测图像特征的目标识别算法进行实验验证。