关键词natural language grounding
搜索结果 - 4
- EMNLP学会停止:一种简单而有效的城市视觉语言导航方法
本论文提出了一种基于训练停止策略模块的 Vision-and-Language Navigation 模型,能够在现实世界的环境中通过自然语言指示来准确导航, 相较于传统方法性能得到了 6.89% 的提升。
- 学习使用语言树结构合成和推理视觉基础
本文提出了一种基于 RVG-TREE 的自然语言基础模型,其可以自动组成二叉树结构进行语言解析,并沿着树进行自底向上的视觉推理,实现更具解释性的推理效果。
- ACL视觉语言导航的多模态判别模型
本论文提出了一种使用多模态对齐的鉴别器来评估视觉和语言导航任务中的自然语言指令,以及通过预训练组件暖启动 VLN 代理以改善其在以前看不见的环境中的表现的方法。
- CVPR通过叙述式示范进行奖励学习
该研究提出了一种联合学习自然语言基础和可教授行为策略的方法,并使用叙述视觉演示(NVD)对其进行监督。通过将指导者描述映射到感知奖励探测器,训练对应的行为策略。通过实验表明,具有自然语言指导的可教授代理人可以在测试时执行涉及新对象和新位置的