关键词visual-language models
搜索结果 - 21
  • 在未知的动态环境中使用三维语义地图进行开放词汇的移动操作
    PDF8 days ago
  • 从冗余到相关性:增强多模态大型语言模型的可解释性
    PDFa month ago
  • SEP:自我增强的视觉语言模型提示调整
    PDFa month ago
  • 探索大型基础模型在开放词汇 HOI 检测中的潜力
    PDF3 months ago
  • ICLROpenNeRF:使用像素级特征和渲染新视图的开放式 3D 神经场景分割
    PDF3 months ago
  • OpenGraph: 大规模户外环境中的开放词汇层次化三维图谱表示
    PDF4 months ago
  • 文本知识的重要性:跨模态共教带来的一般化视觉类别发现
    PDF4 months ago
  • CVPR通过上下文残差学习与少样本提示实现通用异常检测
    PDF4 months ago
  • 基于提示的无监督领域自适应的分布对齐
    PDF7 months ago
  • EZ-CLIP:高效零样本视频行为识别
    PDF7 months ago
  • 图像搜索的当代艺术:通过视觉语言模型进行迭代用户意图扩展
    PDF7 months ago
  • TCP: 面向视觉语言模型的基于文本的类别感知启发式调整
    PDF7 months ago
  • 基于文本提示的空间协变图像配准
    PDF7 months ago
  • VLIS: 单模态语言模型指导多模态语言生成
    PDF9 months ago
  • 视频 CSR: 复杂视频摘要生成用于视觉 - 语言模型
    PDF9 months ago
  • 视觉分布校准和跨模态分布对齐的小样本学习
    PDFa year ago
  • CLIP-Count: 基于文本引导的零样本物体计数
    PDFa year ago
  • Anything-3D: 面向野外的单视角任意物体重建
    PDFa year ago
  • 探究大型视觉语言模型的概念理解
    PDFa year ago
  • 机器人导航的视觉语言地图
    PDF2 years ago
Prev