关键词multi-modal representation
搜索结果 - 13
- 3D VR 草图引导的 3D 形状原型制作和探索PDFa year ago
- ICMLLIV: 语言 - 图像表示和奖励在机器人控制中的应用PDFa year ago
- 分子形态对比预训练用于可转移分子表示PDFa year ago
- 分离关注力:具有上下文语境的无监督多物体发现PDFa year ago
- 级联自注意力和互注意力块的视觉问答PDFa year ago
- 时尚领域的遮蔽视觉语言变压器PDF2 years ago
- ACL基于领域感知的自监督预训练,用于标签少的模因分析PDF2 years ago
- 多模态片段拼接网络在广告视频编辑中的应用:基于重要性 - 连贯奖励PDF2 years ago
- CVPR三维视觉对接的多视图 TransformerPDF2 years ago
- CVPR一次搞定 —— 用于视频检索的多模态融合 TransformerPDF3 years ago
- ICCVTACo: 基于 Token 的级联对比学习,用于视频文本对齐PDF3 years ago
- 利用视觉 - 语言预训练实现医学图像和文本的多模态理解与生成PDF3 years ago
- 学习鲁棒的视觉 - 语义嵌入PDF7 years ago
Prev
Next