使用移动机器人的交互式导航的分层强化学习

Oct, 2019

使用移动机器人的交互式导航的分层强化学习

HRL4IN: Hierarchical Reinforcement Learning for Interactive Navigation with Mobile Manipulators

Chengshu Li, Fei Xia, Roberto Martin-Martin, Silvio Savarese

TL;DR提出了一种新型的分层强化学习架构 HRL4IN，用于解决包含导航和操作任务的具有异构性的交互式导航任务问题，并且能够提高能源效率。在 2D 网格世界环境和 3D 物理仿真环境中，HRL4IN 相对于平面 PPO 和 HAC 等算法，在任务性能和能源效率方面的表现明显优于其他基线算法。

Abstract

Most common navigation tasks in human environments require auxiliary arm interactions, e.g. opening doors, pressing buttons and pushing obstacles away. This type of navigation tasks, which we call interactive navigation, requires the use of →

interactive navigation mobile manipulators hierarchical rl architecture long-horizon tasks energy efficiency

发现论文，激发创造

城市环境中安全互动自主驾驶的想象增强分层强化学习方法

通过引入想象增强的分层强化学习算法，我们设计了一种新的导航算法，使得智能体能够在真实世界的导航任务中学习安全和交互的行为，提高了成功率并减少了平均步骤的数量。

Nov, 2023

ReProHRL: 多目标导航中的层级代理在真实环境中的应用

我们提出了一种名为 Ready for Production Hierarchical RL（ReProHRL）的方法，它通过强化学习来划分具有层次结构的多目标导航任务，并使用物体检测器作为预处理步骤来学习多目标导航并将其转移到真实世界中，实证结果表明，所提出的 ReProHRL 方法在模拟和真实环境中的训练时间和性能方面均优于最先进的基线方法。

Aug, 2023

移动机器人多目标协作交互式搜索层次学习

本文介绍了一种新颖的交互式多对象搜索任务，并提出了一种层次强化学习方法，学习探索、导航和操作技能，该方法在模拟和实际的实验中展示了零样本迁移和对不同机器人运动学的适应性。

Jul, 2023

采用分层式 Sim2Real 实现的多智能体运动操控

采用强化学习方法通过层次性模拟实现在多移动机器人协作下的操纵行为。

Aug, 2019

从像素到四肢：四足动物运动的分层学习

使用分层强化学习的方法，我们设计了一个四足机器人的策略网络，使之可以对复杂场景和地形进行动态腿部动作并同时处理视觉输入，体现障碍物回避和路径规划，此网络同时学习高层次神经网络策略和底层神经网络策略，达到相对于不分层的神经网络策略更高的学习效率。

Nov, 2020

N$^2$M$^2$: 在未知和动态环境中学习任意移动操作导航

本研究提出一种名为神经导航移动操控（N$^2$M$^2$）的方法，通过将移动操控任务分解为任务空间中的简化运动生成器和移动基地的训练强化学习代理，同时通过对复杂障碍环境的扩展，可以在未知环境中执行不可见、长视距任务，并立即对动态障碍和环境变化做出反应。

Jun, 2022

层次化跨模态机器人视觉语言导航智能体

该研究论文提出了一种基于连续三维重建环境的机器人视觉和语言导航（Robo-VLN）的设定，并利用分层决策，模块化训练和分离推理和模仿的策略，成功地解决了 Robo-VLN 这一新任务。通过使用 HCM 代理，研究者展示了比现有基线效果更好的结果，为 Robo-VLN 创造了新的基准。

Apr, 2021

面向意图的层次强化学习

研究使用基于眼动的意图来自动生成子目标，从而提高深度强化学习代理的样本效率。该方法在 Atari 2600 游戏套件中的 Montezuma's Revenge 等长视程罕见奖励任务中得到了验证。

Jun, 2023

使用强化学习在限制的行人环境下实现机器人导航

本文提出了基于强化学习（RL）的方法来解决移动机器人在密闭空间中与行人互动的导航问题，探索了多个场景下训练准则的可复用性，并在两个真实环境的三维重建中表现出了良好的迁移能力。

Oct, 2020

学习在复杂环境中导航

利用增强学习问题和多模态感应输入的辅助深度预测和循环闭环分类任务，可以学习从复杂 3D 迷宫中进行导航并接近人类级别表现

Nov, 2016