关键词multi-modal alignment
搜索结果 - 8
- 鉴别器引导的合作扩散用于联合音频和视频生成PDFa month ago
- 将动作与行走与由 LLM 生成的文本描述对齐PDF3 months ago
- FSMR:一种基于特征交换的多模态推理方法,结合文本和视觉线索PDF3 months ago
- RECAP: 检索增强音乐字幕生成器PDF2 years ago
- ECCVEgo4D 自然语言查询挑战 2022 中的高效粗 - 细对齐框架PDF2 years ago
- CONE:一种针对长视频时间对齐的高效粗到细对齐框架PDF2 years ago
- 从特征和样本的视角重新思考视频问答中的多模态对齐PDF2 years ago
- ACL视觉语言导航的多模态判别模型PDF5 years ago
Prev
Next