BriefGPT.xyz
Ask
alpha
关键词
cav-mae
搜索结果 - 1
ICLR
对比音视频掩码自编码器
本文提出了 CAV-MAE 模型,它将 Masked Auto-Encoder (MAE) 模型从单模态扩展到音频 - 视觉多模态,并结合自监督学习框架中的对比学习和蒙版数据建模两种方法,学习联合和协调的音频 - 视觉表示,并在 VGGSo
→
PDF
2 years ago
Prev
Next