BriefGPT.xyz
Ask
alpha
关键词
kinetics-600
搜索结果 - 2
利用 VQVAE 模型预测视频
本文提出了一种基于 VQ-VAE 的视频预测方法,将高分辨率视频压缩为一组分层多尺度离散潜在变量,然后应用可扩展自回归生成模型,相对于先前的工作,更关注大规模多样化的数据集,并使用人工评估验证了其效果。
PDF
3 years ago
CVPR
时空对比视频表征学习
本文引入了一种基于对比损失的自监督对比视频表示学习方法,利用在嵌入空间中相同短视频的两个增强剪辑进行学习,同时将来自不同视频的剪辑分开。这种自我监督学习方法需要好的数据增强和虚拟时间和模拟空间的知识,在 Kinetics-600 数据集上,
→
PDF
4 years ago
Prev
Next