关键词video-language pre-training
搜索结果 - 11
- 统一的视频 - 语言联合预训练与同步音频PDF2 months ago
- Video-LaVIT:统一的视频 - 语言预训练与解耦的视觉 - 运动词汇编PDF5 months ago
- MMRTQ:基于图文模型重新思考视频语言理解PDF7 months ago
- TESTA: 长篇视频 - 语言理解的时间空间令牌聚合PDF8 months ago
- EgoVLPv2: 骨干网络中融合的自我中心视频语言预训练PDFa year ago
- 时间感知的视频 - 语言预训练PDFa year ago
- 用于高效视频文本检索的掩码对比预训练PDF2 years ago
- SMAUG:用于高效视频语言预训练的稀疏掩蔽自编码器PDF2 years ago
- ICLRCLIP-ViP:基于预训练图文模型的视频语言表示对齐PDF2 years ago
- CVPR针对检索的目标感知视频语言预训练PDF3 years ago
- CUPID: 视语表征学习的预训练数据自适应筛选PDF3 years ago
Prev
Next