通过深度强化学习实现平滑轨迹避碰

ICMLOct, 2022

通过深度强化学习实现平滑轨迹避碰

Smooth Trajectory Collision Avoidance through Deep Reinforcement Learning

Sirui Song, Kirk Saunders, Ye Yue, Jundong Liu

TL;DR本论文针对 DRL 导航解决方案中的两个核心问题提出了多种新的代理状态和奖励函数设计，即平滑性训练轨迹和模型泛化能力，利用边缘奖励和平滑度约束来确保无人机平稳飞行，同时大大降低碰撞风险，并演示整个设计和各组件的有效性。

Abstract

collision avoidance is a crucial task in vision-guided autonomous navigation. Solutions based on deep reinforcement learning (DRL) has bec

collision avoidance deep reinforcement learning navigation smoothness model generalization

发现论文，激发创造

基于深度强化学习的避障轨迹规划与鲁棒低层控制方法在机器人操纵器中的应用

在机器人学中，我们提出了一种集成无障碍深度强化学习轨迹规划器和新颖的自适应低级和关节级控制策略的方法，通过与环境的交互来激活学习阶段，解决了学习基于模型的复杂性和稳定性和安全性之间的挑战。

Feb, 2024

基于端到端强化学习的四旋翼群体的避障和导航

在包含障碍物的环境中，我们提出一种使用端到端深度强化学习（DRL）控制无人机群的方法，该方法通过提供课程和剪辑碰撞情景的重放缓冲区来改善性能，并且实现了对邻居机器人和障碍物交互的注意机制。这是首次成功地将该机制应用于在计算资源受限的硬件上部署的群体行为策略，我们的方法可以在模拟环境中实现 32 架机器人并达到 80％的障碍物密度，在实际物理环境中可以实现 8 架机器人并达到 20％的障碍物密度，并且可以零 - shot 地转移到真实的无人机上。

Sep, 2023

无人机安全多智能体运动规划中的不确定性下滤波强化学习

我们提出一种可行的、基于强化学习和约束控制轨迹规划的无人机多智能体安全运动规划器，可以处理不确定的、杂乱的工作空间，并确保安全性、避免碰撞。该方法能够实时实施，相对于仅基于学习的方法，训练过程更简单，数值模拟和实验证明了该方法的有效性。

Oct, 2023

深度强化学习中动态决策机构的运动规划

本文介绍了一种基于深度强化学习和 LSTM 的算法，可以在不使用特定行为规则的情况下，学习各种类型的动态代理之间的避碰。通过仿真和在全自主机器人车辆上的实验，证明了该算法随着代理数量的增加能够更好地执行避碰，并且不需要使用 3D 激光雷达。

May, 2018

深度强化学习避碰系统的奖励函数优化

该研究探讨使用代理优化器来调整深度强化学习算法，以优化多种航空器平台，包括无人机的碰撞回避能力，从而提高安全性和操作可行性。

Dec, 2022

移动机器人避障的安全实践强化学习

本文提出了一种结合现实强化学习、基于搜索的在线轨迹规划和自动紧急情况干预的高效碰撞避免系统，用于在室内实际环境下的移动机器人安全行驶。实验结果显示该方法比多种基线更优秀，可以实现更高的平均速度、更低的碰撞频率、更高的目标达成率、更小的计算开销和更平滑的整体控制。

Sep, 2022

基于强化学习的空中交通冲突解除

本文使用强化学习算法，最小化无人机避障中的水平分离问题，将避障策略转化为一组航迹点，以满足安全需求，并在高保真模拟和实际飞行演示中进行了评估。

Jan, 2023

基于强化学习的自动驾驶安全、高效、舒适速度控制

该论文基于深度强化学习提出了一种用于汽车跟随速度控制的模型，通过对车辆速度的控制以最大化累积奖励，实现安全、高效和舒适的车跟随行为，并与实际数据进行了对比，结果表明强化学习方法在无人驾驶系统开发方面具有潜在的贡献。

Jan, 2019

安全导航：在 CARLA 中使用深度强化学习进行自主车辆训练

自主驾驶汽车使用深度强化学习技术在不确定环境中进行决策，通过使用 CARLA 模拟器在真实城市环境中训练和测试自动驾驶模型，实现了准确的对象识别和距离估计以及有效的交通导航。

Oct, 2023

PathRL：一种基于深度强化学习的端到端避障路径生成方法

通过使用深度强化学习 (DRL) 的机器人导航，可以提高移动机器人的性能。然而，现有的基于 DRL 的导航方法主要集中于训练一个直接命令机器人进行低级控制的策略，导致机器人在长期执行过程中速度不稳定、轨迹不平滑。我们提出了一种名为 PathRL 的新型 DRL 方法，通过训练策略来生成机器人的导航路径，具有更高的成功率和减少了角度旋转变异性的优势，实现了稳定和流畅的机器人移动。

Oct, 2023