关键词vlms
搜索结果 - 35
  • ICAL: 将轨迹转化为可行动洞见的多模态智能体的持续学习
    PDF14 days ago
  • 通过对目标令牌进行上下文注入,增强视觉语言模型中的跨提示可转移性
    PDF15 days ago
  • RoboPoint:机器人的空间可行性预测的视觉语言模型
    PDF19 days ago
  • CVPR探索视觉语言组合性和识别的光谱
    PDF21 days ago
  • MiniGPT - 反设计:利用 MiniGPT-4 预测图像调整
    PDFa month ago
  • 视觉对齐中的图像识别:优先考虑视觉相似性
    PDFa month ago
  • 隐私感知的视觉语言模型
    PDFa month ago
  • DreamScene4D: 从单目视频生成动态多物体场景
    PDF2 months ago
  • 构建视觉 - 语言模型时的要点
    PDF2 months ago
  • 超越人类视角:大型视觉语言模型在显微镜图像分析中的作用
    PDF2 months ago
  • 通过多知识表示优化视觉语言模型的提示学习
    PDF3 months ago
  • RESSA:通过稀疏跨模态适应修复稀疏视觉语言模型
    PDF3 months ago
  • CVPRViTamin:设计可扩展的视觉模型在视觉语言时代
    PDF3 months ago
  • Mini-Gemini: 挖掘多模视觉语言模型的潜力
    PDF3 months ago
  • CFPL-FAS: 无类别提示学习的通用人脸反欺骗
    PDF3 months ago
  • 面向视觉与语言模型的多模态上下文学习
    PDF3 months ago
  • ACL基于图表的推理:从 LLMs 向 VLMs 的能力转移
    PDF3 months ago
  • ICLR图像胜于千言:视觉语言模型间的提示对抗传递
    PDF4 months ago
  • 利用 WebSight 数据集解锁网页截图转换为 HTML 代码
    PDF4 months ago
  • ICLR智能视觉演绎推理有多远?
    PDF4 months ago
Prev