基于离线预训练强化学习的规避导航

Aug, 2023

基于离线预训练强化学习的规避导航

Avoidance Navigation Based on Offline Pre-Training Reinforcement Learning

Yang Wenkai Ji Ruihang Zhang Yuxiang Lei Hao, Zhao Zijie

TL;DR本文提出了一种无地图的移动机器人规避导航的预训练深度强化学习方法，通过将原始传感器数据映射到控制变量并在未知环境中导航。我们提出了高效的离线训练策略，用于加速早期低效的随机探索，并收集了一个包含专家经验的通用数据集，对其他导航训练工作具有一定的意义。全面验证了预训练和优先专家经验可以减少 80％的训练时间，并且已经证实可以提高 DRL 的 2 倍奖励。通过先进的仿真 gazebo 与真实物理建模和动力学方程的结合，减小了仿真与实际之间的差距。我们在走廊环境中训练了我们的模型，并在不同环境中评估了模型，获得了相同的效果。与传统导航方法相比，我们可以确认训练好的模型可以直接应用于不同场景，并具有无碰撞导航的能力。实验证明我们的 DRL 模型具有在不同环境下的通用性能。

Abstract

This paper presents a pre-training deep reinforcement learning(DRL) for avoidance navigation without map for mobile robots which map raw s

pre-training deep reinforcement learning avoidance navigation mobile robots offline training strategy universal dataset

发现论文，激发创造

基于双重强化学习技术的地面移动机器人增强低维度感知无地图导航

通过比较分析基于深度 Q 网络（DQN）算法和基于双重深度 Q 网络（DDQN）算法的深度强化学习（Deep-RL）策略，本研究提出了两种不同的方法，旨在增强地面移动机器人的无地图导航能力。这些方法中的智能体利用来自激光范围采样的 24 个测量，以及与目标的位置差异和方向相关的智能体位置数据，通过融合这些数据来影响导航决策，从而最终控制机器人的速度。实验结果表明，相比于简单的 Q 结构，双重深度结构显著提高了移动机器人的导航能力，且无需依赖于复杂的感知输入，如基于图像的方法。

Oct, 2023

虚拟到实际的深度强化学习：用于无地图导航的移动机器人连续控制

通过深度强化学习方法训练，可直接应用于未知的虚拟和实际环境中的地面移动机器人的无地图运动规划器。

Mar, 2017

使用深度强化学习的机器人路径规划

本文介绍了如何使用强化学习方法和深度 Q 网络等算法，使得机器人可以在未知环境中进行自主导航的任务。我们还利用模拟环境对机器人代理的行为和性能进行了验证和分析。

Feb, 2023

用于地面移动机器人低维感知无地图导航的双深度强化学习技术

本文研究了如何使用深度强化学习和双重深度 Q 神经网络算法来优化无地图导航中移动机器人的导航和避障任务，并证明使用双重深度 Q 结构比简单 Q 结构更有效。

Jan, 2023

采用强化学习的路径生成与细化运动控制的机器人导航

本文提出了一种基于强化学习的路径生成（RL-PG）方法，以用于移动机器人导航，无需事先探索未知环境。该方法采用深度马尔可夫模型优化的 RL 算法生成多个预测路径点，通过运动微调模块 fine-tuning 机器人的运动以确保跟踪预测点时的安全。通过在模拟和物理平台上的部署，证明本文提出的方法有效并且其成功率更高于 DWA-RL 和传统的 APF 导航方法。

Oct, 2022

基于强化学习的移动机器人局部路径规划

评估了具有深度 Q-Learning 和 Deep DQN 结构的机器学习算法，以解决自主移动机器人避开障碍物的路径规划问题。

Oct, 2023

安全导航：在 CARLA 中使用深度强化学习进行自主车辆训练

自主驾驶汽车使用深度强化学习技术在不确定环境中进行决策，通过使用 CARLA 模拟器在真实城市环境中训练和测试自动驾驶模型，实现了准确的对象识别和距离估计以及有效的交通导航。

Oct, 2023

先斩后奏：桥接基于模型和基于模型的无模型强化学习，为规划先进的视觉语言导航

本文提出了一种新颖的，提前计划的混合增强学习模型，将模型无关的和模型基于的强化学习相结合，以解决实际的视觉语言导航任务，并且实验结果表明，该方法在真实数据集上表现最佳，还具有更好的可扩展性。

Mar, 2018

移动机器人避障的安全实践强化学习

本文提出了一种结合现实强化学习、基于搜索的在线轨迹规划和自动紧急情况干预的高效碰撞避免系统，用于在室内实际环境下的移动机器人安全行驶。实验结果显示该方法比多种基线更优秀，可以实现更高的平均速度、更低的碰撞频率、更高的目标达成率、更小的计算开销和更平滑的整体控制。

Sep, 2022

EnCoMP: 提升的秘密机动规划的离线强化学习

提出了一种增强型导航系统，使机器人能够识别和利用自然和人工的环境特征作为掩护，从而减少对潜在威胁的暴露，并以高效的方式进行导航。通过使用 LiDAR 数据生成高保真度的掩护地图和潜在威胁地图，我们的感知管道提供了对周围环境的全面理解。通过使用从真实环境中收集的多样化数据集训练离线强化学习模型，学习一个评估候选动作质量的强大策略，该策略基于其最大化掩护利用、最小化对威胁的暴露以及有效到达目标的能力。广泛的真实世界实验证明了我们的方法在成功率、掩护利用、暴露最小化和导航效率方面相对于最先进方法的优越性。

Mar, 2024