关键词multi-modal representation
搜索结果 - 13
  • 3D VR 草图引导的 3D 形状原型制作和探索
    PDFa year ago
  • ICMLLIV: 语言 - 图像表示和奖励在机器人控制中的应用
    PDFa year ago
  • 分子形态对比预训练用于可转移分子表示
    PDFa year ago
  • 分离关注力:具有上下文语境的无监督多物体发现
    PDFa year ago
  • 级联自注意力和互注意力块的视觉问答
    PDFa year ago
  • 时尚领域的遮蔽视觉语言变压器
    PDF2 years ago
  • ACL基于领域感知的自监督预训练,用于标签少的模因分析
    PDF2 years ago
  • 多模态片段拼接网络在广告视频编辑中的应用:基于重要性 - 连贯奖励
    PDF2 years ago
  • CVPR三维视觉对接的多视图 Transformer
    PDF2 years ago
  • CVPR一次搞定 —— 用于视频检索的多模态融合 Transformer
    PDF3 years ago
  • ICCVTACo: 基于 Token 的级联对比学习,用于视频文本对齐
    PDF3 years ago
  • 利用视觉 - 语言预训练实现医学图像和文本的多模态理解与生成
    PDF3 years ago
  • 学习鲁棒的视觉 - 语义嵌入
    PDF7 years ago
Prev
Next