用于导航 ViZDoom “我的回家之路” 迷宫的紧急 Braitenberg 风格行为
通过基于模型的强化学习技术,本研究提出了一种用于导航和解决迷宫游戏的机器人系统的开发与训练。该方法通过从摄像头图像中提取低维观测以及裁剪和校正的以迷宫当前位置为中心的图像块,为迷宫布局提供了有价值的信息。控制策略的学习完全在物理系统上进行,使用基于模型的强化学习方法,其中沿着迷宫路径的进展作为奖励信号。此外,我们利用系统固有的对称性增加了训练数据。因此,我们的方法通过仅使用 5 小时的真实世界训练数据,在极短时间内成功解决了一种流行的真实世界迷宫游戏。
Dec, 2023
本文提出了一种适用于室内机器人导航的语义图形表示方法,该表示方法以语义位置和导航行为为节点和边,利用深度学习架构直接从视觉输入生成导航行为,无需计算机器人精确位置和环境几何关系,实现以更高的语义抽象水平导航的目的。
Mar, 2018
本研究使用 2D 模拟 Morris 水迷宫来训练深度强化学习代理程序,并自动分类了导航策略, 将人工智能的学习动力学与动物实验数据进行比较。通过开发环境特定的辅助任务来研究影响其有用性的因素, 最后研究了人工代理神经网络中激活的内部表征的发展,这些表征类似于老鼠大脑中发现的 place cells 和 head-direction cells,并且它们的存在与人工代理采用的导航策略有相关性。
Jun, 2023
该论文提出一种基于深度强化学习的城市级别自主导航模型,采用 Google StreetView 进行环境交互和训练,具备可迁移性和区域特征一致性,实现了在多个城市环境下自主导航到目标位置。
Mar, 2018
通过利用大规模的房屋导览视频数据集,本文提出了一种视觉语言导航方法,使用自动构建的路径指令对训练的代理进行预训练,并利用视频中的布局信息来提高导航的泛化性能。通过实验结果表明,该方法在两个流行的基准测试(R2R 和 REVERIE)上取得了最先进的性能。
Jul, 2023
本文提出了一种新的结构化状态演化(SEvol)模型,采用基于图的特征来表示导航状态,利用增强学习策略通过 Reinforced Layout clues Miner(RLM)挖掘和检测关键的布局图,并通过结构演化模块(SEM)来维护结构化基于图的状态,从而提高了 Vision-and-language Navigation 任务的性能。
Apr, 2022
本文介绍一种基于图神经网络和卷积 / 循环神经网络实现的原始行为分解的、使用拓扑地图进行视觉导航的新方法,并在 Gibson 模拟器中验证了其在已知和未知环境中导航的性能优于相关基准线。
Mar, 2019
介绍了一种层次感知模型,结合认知地图、空间感知和位置运动,通过基于像素的观察推断出环境结构,并能在迷你格环境中进行高效探索和目标导向搜索。
Sep, 2023