从视觉到移动:视觉室内导航学习综述
本文介绍了数据扩充方法以改善现有的人工智能模型在 VLN 任务中性能表现不佳的问题,该方法利用了 Matterport3D 数据集中的元数据信息来引导新的导航指令的生成,并在未见过的环境中使性能提高了 8%。
Oct, 2022
WIN 是一个用于视觉语言导航任务的常识学习模型,它基于以前的经验,预测未知环境中的相邻房间,并通过局部 - 全局规划和本地性学习提供更好的智能导航性能。
Sep, 2023
提出了一个基于学习的导航系统,该系统应用于实际移动机器人平台,旨在使机器人通过学习来了解环境和导航便利性,以便在视觉引导下实现目标点的导航,经过实地测试和应用,该系统的表现优于其他以强化学习和搜索为基础的方法。
Dec, 2020
综述了目前关于具有各种智能技能的智能机器人在 3D 环境中进行导航的研究领域,着重介绍了在这一领域内的各种高级技能,例如:感知局部观察视觉输入,理解跨模态的指令等等,并探讨了未来的研究方向及挑战。
Jul, 2021
本文介绍了一种基于 ViNL 的视觉导航和运动方案,其中包括一个视觉导航策略和一个视觉运动策略,它们都是完全 “无模型” 的,通过端到端训练的神经网络来实现机器人在未知室内环境中的智能导航和避开障碍物的智能视觉运动。
Oct, 2022
该研究提出了一种基于人类导航行为的智能视觉语言导航策略,通过赋予代理人主动信息收集能力和学习探索策略来解决当前方法产生的不确定性问题和效率低下问题,实验证明该方法能显著提高导航性能。
Jul, 2020
为了成功,视觉语言导航(VLN)代理人必须能够根据周围环境将指令与行动联系起来。本研究开发了一种研究基于技能的代理人行为的方法,检查现有代理人在停止、转向和移动向指定对象或房间方面如何准确地进行指令的实施。我们的方法基于生成针对不同技能的干预措施,并测量代理人预测的变化。我们展示了一个详细的案例研究,分析了最新代理人的行为,然后比较了多个代理人在技能特定的能力评分方面。这种分析表明,训练中的偏见对代理人的行为具有持久影响,并且现有的模型能够建立简单的指称表达式。我们在模型之间的比较中发现,技能特定的评分与整体 VLN 任务表现的改进相关。
Jul, 2023