一种用于无人机自主降落平台的深度强化学习策略

Sep, 2022

一种用于无人机自主降落平台的深度强化学习策略

A Deep Reinforcement Learning Strategy for UAV Autonomous Landing on a Platform

Z. Jiang, G. Song

TL;DR本文阐述了如何将深度强化学习算法应用于机器人领域，主要关注于以物理模拟平台为基础的无人机飞行任务控制，使用基于 Gazebo 的强化学习框架进行训练，最终成功实现了无人机自主降落的任务

Abstract

With the development of industry, drones are appearing in various field. In recent years, deep reinforcement learning has made impressive gains in games, and we are committed to applying →

drones deep reinforcement learning robot control physical simulation autonomous landing

发现论文，激发创造

自主飞行器基于深度强化学习的长期规划

本文研究了基于现实生活中无人机赛事的长期规划场景，对使用 PPO 算法训练的强化学习智能体在无人机比赛中与使用传统路径规划算法的模拟无人机进行了实验，使用对手无人机的 GPS 信息作为专家指导进行训练，成功解决了复杂状态空间问题，其代码可以在我们的 GitHub 存储库中找到。

Jul, 2020

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020

自主无人机导航的强化学习应用：系统综述

该研究探讨了使用强化学习算法解决无人机导航问题，讨论了不同环境下的算法特性和选择，并提出未来的研究方向。

Aug, 2022

DRIFT: 智能浮动平台轨迹的深度强化学习

该研究提出了一种基于深度强化学习的新型套件，用于控制模拟和真实环境中的浮动平台，在动态和不可预测的条件下实现精确操纵，并具备鲁棒性、适应性和从模拟到现实的良好迁移能力。

Oct, 2023

基于深层模型的强化学习学习飞行

通过学习无人机动力学的概率模型，我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器，完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。

Mar, 2020

基于强化学习的空战机动生成

本研究提出了一种利用深度强化学习技术（TD3）和经验回放（HER）来优化具有 Dubin 车辆动力学特性的无人机在二维空间中达到目标路径的方法，并在两种不同环境下进行了模拟实验，可用于 UAV 自主机动决策等领域。

Jan, 2022

无人机自主降落的多模态学习方法

该研究介绍了一种基于多模式变压器的深度学习探测器，可为精确自主着陆提供可靠的定位，同时还提出了一种基于深度 Q 网络的强化学习决策模型，该模型在模拟环境中进行训练，然后成功地在真实户外场景中验证其适用性。

May, 2024

使用策略和奖励塑形的无人机控制强化学习

本研究采用奖赏塑形和策略塑形技术同时训练 RL 智能体，以控制无人机；结果表明，与仅使用基于策略的方法训练智能体相比，使用两种技术同时训练的智能体获得了较低的回报，但训练期间达到了更低的执行时间和更少的离散度。

Dec, 2022

自主驾驶的深度强化学习：一份综述

本文综述了深度强化学习算法在自动驾驶任务上的应用，包括分类、验证、测试和强化现有强化学习算法解决方案的方法，还介绍了相关领域和挑战。

Feb, 2020

利用深度强化学习实现无人机的主动感知

使用图像处理技术和简单的深度强化学习（Deep-RL）代理，无需使用复杂的卷积神经网络（CNN）或对比学习（CL），就可以追踪和识别水面结构以进行动态着陆，从而为无人机的主动感知做出了贡献。

Sep, 2022