关键词vision and language models
搜索结果 - 18
  • SK-VQA:用于训练上下文增强的多模态 LLM 的大规模合成知识生成
    PDF6 days ago
  • CVPR探索视觉语言组合性和识别的光谱
    PDF21 days ago
  • ColorFoil:大规模视觉与语言模型中色盲调查
    PDFa month ago
  • CVPRQ-GroundCAM: 通过 GradCAM 度量视觉语言模型中的基准化能力
    PDF2 months ago
  • 视觉与语言解码器是否平等使用图像和文本?它们的解释是否自洽?
    PDF2 months ago
  • OpenDlign: 用深度对齐图像提升开放世界三维学习
    PDF2 months ago
  • 用于标题和检索遥感图像的大规模语言模型
    PDF5 months ago
  • 面向动物身体和面部的语言驱动开放词汇关键点检测
    PDF9 months ago
  • 场景细化器:在图像中以形态水平为基础的主题定位
    PDF9 months ago
  • 基于基础模型和形式验证的规范驱动视频搜索
    PDF10 months ago
  • TAP:针对视觉分类任务自适应生成文本训练实例的有针对性提示
    PDF10 months ago
  • ICCV多模基础模型的对抗鲁棒性
    PDF10 months ago
  • 对比视觉语言细粒度理解中的同模态句式和排名跨模态硬负例
    PDFa year ago
  • CVPR为视觉和语言模型命名类别的学习
    PDFa year ago
  • MM-SHAP:一种性能不可知的度量方法,用于测量视觉和语言模型与任务中的多模式贡献
    PDF2 years ago
  • CPL: 计数器事实提示学习用于视觉和语言模型
    PDF2 years ago
  • ICLR视听模型何时以及为何表现为词袋模型,以及此问题的解决方案是什么?
    PDF2 years ago
  • ECCV利用视觉和语言模型开发目标检测算法的无标签数据
    PDF2 years ago
Prev
Next