关键词language grounding
搜索结果 - 21
  • 从文本描述中生成三维场景的人类动作
    PDF2 months ago
  • DecisionNCE: 通过隐式偏好学习实现的具身多模态表示
    PDF4 months ago
  • GRASP: 用于评估多模态语言模型中语言引用与情境物理理解的新型基准测试
    PDF8 months ago
  • HandMeThat:物理和社交环境中的人机通信
    PDF9 months ago
  • 利用多模态引导在长视频中定位时刻
    PDFa year ago
  • 将互联网规模的视觉 - 语言模型化为具体智能体
    PDFa year ago
  • 通过指导提升结构化探索实现物体导航
    PDF2 years ago
  • 走向目标:基于场景的足球评论资源
    PDF2 years ago
  • 基于最优传输对跨领域摘要生成的语义一致性对齐
    PDF2 years ago
  • 语言基础的信任:人机协作中的新 AI 挑战
    PDF2 years ago
  • ACLWebShop: 面向可扩展的真实世界网络交互的基于场景语言智能体
    PDF2 years ago
  • 语言与视觉:基于场景的词语和句子嵌入研究
    PDF2 years ago
  • 基于区域特定动态层注意力融合的自主车辆指令落地
    PDF2 years ago
  • 全局思考,本地行动:面向视觉和语言导航的双尺度图形 Transformer
    PDF2 years ago
  • ICLR通过目标生成将语言与自主获得的技能联系起来
    PDF4 years ago
  • 在基于图像场景环境的语义空间中融合视觉语义到句子表示中
    PDF4 years ago
  • ShapeGlot: 学习形状区分的语言
    PDF5 years ago
  • 在街景中学习遵循指示
    PDF5 years ago
  • ICLR在二维环境中的交互式基于语境的语言习得和推理
    PDF6 years ago
  • 在模拟的 3D 世界中的基于场景语言学习
    PDF7 years ago
Prev