关键词multi-modal alignment
搜索结果 - 8
  • 鉴别器引导的合作扩散用于联合音频和视频生成
    PDFa month ago
  • 将动作与行走与由 LLM 生成的文本描述对齐
    PDF3 months ago
  • FSMR:一种基于特征交换的多模态推理方法,结合文本和视觉线索
    PDF3 months ago
  • RECAP: 检索增强音乐字幕生成器
    PDF2 years ago
  • ECCVEgo4D 自然语言查询挑战 2022 中的高效粗 - 细对齐框架
    PDF2 years ago
  • CONE:一种针对长视频时间对齐的高效粗到细对齐框架
    PDF2 years ago
  • 从特征和样本的视角重新思考视频问答中的多模态对齐
    PDF2 years ago
  • ACL视觉语言导航的多模态判别模型
    PDF5 years ago
Prev
Next