关键词image-text models
搜索结果 - 9
  • MMRTQ:基于图文模型重新思考视频语言理解
    PDF7 months ago
  • MobileCLIP: 多模态加强训练的快速图像 - 文本模型
    PDF7 months ago
  • 分析视觉语言模型在视频理解任务上的零样本能力
    PDF9 months ago
  • 谓词扩散:基于谓词逻辑的文本到图像扩散模型的注意力引导
    PDF9 months ago
  • CVPREgo4D 长期动作预测的 Video + CLIP 基线
    PDF2 years ago
  • CLIP-Hitchhiker 的长视频检索指南
    PDF2 years ago
  • ECCV使用视觉 Transformer 进行简单的开放词汇物体检测
    PDF2 years ago
  • CVPR基于零样本文本引导的 Dream Fields 对象生成
    PDF3 years ago
  • CVPRLiT: 基于锁定图像文本调整的零次迁移
    PDF3 years ago
Prev
Next