关键词visual grounding
搜索结果 - 110
  • 语言引导扩散模型用于视觉定位
    PDFa year ago
  • 基于中心点监督的迭代稳健视觉定位
    PDFa year ago
  • CVPR运用场景知识推进视觉连接:基准与方法
    PDFa year ago
  • BuboGPT:多模态 LLM 中的视觉定位
    PDFa year ago
  • GVCCI: 语言引导下的机器人操作视觉理解的终身学习
    PDFa year ago
  • OG:采用实例分割和视觉定位技术增强视觉占有率
    PDFa year ago
  • CVPR多任务视觉引导的语言自适应权重生成
    PDFa year ago
  • 模态转移中的杠杆点:比较仅语言和多模态词表示
    PDFa year ago
  • 测量 VQA 中忠实和可信的视觉沟通
    PDFa year ago
  • TreePrompt: 学习编写树状提示以实现可解释的视觉引导
    PDFa year ago
  • CLIP-VG: 利用伪语言标签自适应的 CLIP 自适应自学课程对视觉 grounding
    PDFa year ago
  • 自监督和视觉基础预训练的电影票房预测
    PDFa year ago
  • CVPR自然语言规约下的联合视觉定位及跟踪
    PDFa year ago
  • AAAIDQ-DETR: 双查询检测 Transformer 用于短语提取和基础定位
    PDF2 years ago
  • ECCVYORO -- 轻量级端到端视觉定位
    PDF2 years ago
  • 基于晶格检索的视觉引导 VQA
    PDF2 years ago
  • 当前的解码策略是否能够应对视觉对话的挑战?
    PDF2 years ago
  • 像双语婴儿一样:视觉引导双语语言模型的优势
    PDF2 years ago
  • EMNLP跨语言词向量的视觉定位
    PDF2 years ago
  • ECCVSiRi: 一个用于基于 Transformer 的视觉定位的简单选择性微调机制
    PDF2 years ago