关键词grounding
搜索结果 - 59
  • ECCV借助推理能力强化 3D 视觉定位
    PDF3 days ago
  • 消除 LLM 幻觉需要重新思考泛化
    PDF9 days ago
  • 通过基于实景的学习掌握语言结构
    PDF20 days ago
  • 多模式大型语言模型中的即插即用推理基础
    PDF3 months ago
  • 通过逆事实扰动将语言计划与演示相结合的基础
    PDF3 months ago
  • ReGround: 提升文本和空间定位的无成本方法
    PDF3 months ago
  • 从多模态输入中获取语言知识
    PDF4 months ago
  • 基于综合切分对大型语言模型进行落地:地鼠模型
    PDF4 months ago
  • GRAFFORD: 一份基准数据集,用于测试语言和视觉模型对物体功能的知识
    PDF4 months ago
  • 从人工智能和认知科学的视角进行理论研究
    PDF4 months ago
  • 人工智能的基础
    PDF7 months ago
  • 右边” 在哪儿?:揭示视觉语言导航模型的限制
    PDF7 months ago
  • EMNLP无所依托的 LLMs 中的知觉结构:抽象性和主观性在颜色语言中的影响
    PDF7 months ago
  • 大型语言模型真正地进行了多好的接地?
    PDF8 months ago
  • 大型语言模型是假定的语义基础还是猜测?
    PDF8 months ago
  • 火山:通过自反馈引导修订来减轻多模态幻觉
    PDF8 months ago
  • EMNLPGROOViST:一种视觉叙事中对物体进行定位的度量
    PDF8 months ago
  • EMNLP基于符号规划和代码生成的实地对话
    PDF8 months ago
  • EMNLP基于方法的地基和全面发展:跨模态和跨语言连接研究的一种方法论
    PDF9 months ago
  • Ferret: 任意粒度引用和定位任何内容
    PDF9 months ago
Prev