关键词vision and language models
搜索结果 - 18
- SK-VQA:用于训练上下文增强的多模态 LLM 的大规模合成知识生成PDF6 days ago
- CVPR探索视觉语言组合性和识别的光谱PDF21 days ago
- ColorFoil:大规模视觉与语言模型中色盲调查PDFa month ago
- CVPRQ-GroundCAM: 通过 GradCAM 度量视觉语言模型中的基准化能力PDF2 months ago
- 视觉与语言解码器是否平等使用图像和文本?它们的解释是否自洽?PDF2 months ago
- OpenDlign: 用深度对齐图像提升开放世界三维学习PDF2 months ago
- 用于标题和检索遥感图像的大规模语言模型PDF5 months ago
- 面向动物身体和面部的语言驱动开放词汇关键点检测PDF9 months ago
- 场景细化器:在图像中以形态水平为基础的主题定位PDF9 months ago
- 基于基础模型和形式验证的规范驱动视频搜索PDF10 months ago
- TAP:针对视觉分类任务自适应生成文本训练实例的有针对性提示PDF10 months ago
- ICCV多模基础模型的对抗鲁棒性PDF10 months ago
- 对比视觉语言细粒度理解中的同模态句式和排名跨模态硬负例PDFa year ago
- CVPR为视觉和语言模型命名类别的学习PDFa year ago
- MM-SHAP:一种性能不可知的度量方法,用于测量视觉和语言模型与任务中的多模式贡献PDF2 years ago
- CPL: 计数器事实提示学习用于视觉和语言模型PDF2 years ago
- ICLR视听模型何时以及为何表现为词袋模型,以及此问题的解决方案是什么?PDF2 years ago
- ECCV利用视觉和语言模型开发目标检测算法的无标签数据PDF2 years ago
Prev
Next