关键词image-text models
搜索结果 - 9
- MMRTQ:基于图文模型重新思考视频语言理解PDF7 months ago
- MobileCLIP: 多模态加强训练的快速图像 - 文本模型PDF7 months ago
- 分析视觉语言模型在视频理解任务上的零样本能力PDF9 months ago
- 谓词扩散:基于谓词逻辑的文本到图像扩散模型的注意力引导PDF9 months ago
- CVPREgo4D 长期动作预测的 Video + CLIP 基线PDF2 years ago
- CLIP-Hitchhiker 的长视频检索指南PDF2 years ago
- ECCV使用视觉 Transformer 进行简单的开放词汇物体检测PDF2 years ago
- CVPR基于零样本文本引导的 Dream Fields 对象生成PDF3 years ago
- CVPRLiT: 基于锁定图像文本调整的零次迁移PDF3 years ago
Prev
Next