一种用于无人机自主降落平台的深度强化学习策略
本文研究了基于现实生活中无人机赛事的长期规划场景,对使用 PPO 算法训练的强化学习智能体在无人机比赛中与使用传统路径规划算法的模拟无人机进行了实验,使用对手无人机的 GPS 信息作为专家指导进行训练,成功解决了复杂状态空间问题,其代码可以在我们的 GitHub 存储库中找到。
Jul, 2020
该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据,以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制,从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束,在各种场景参数下做出运动决策。
Jul, 2020
该研究提出了一种基于深度强化学习的新型套件,用于控制模拟和真实环境中的浮动平台,在动态和不可预测的条件下实现精确操纵,并具备鲁棒性、适应性和从模拟到现实的良好迁移能力。
Oct, 2023
通过学习无人机动力学的概率模型,我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器,完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。
Mar, 2020
本研究提出了一种利用深度强化学习技术(TD3)和经验回放(HER)来优化具有 Dubin 车辆动力学特性的无人机在二维空间中达到目标路径的方法,并在两种不同环境下进行了模拟实验,可用于 UAV 自主机动决策等领域。
Jan, 2022
该研究介绍了一种基于多模式变压器的深度学习探测器,可为精确自主着陆提供可靠的定位,同时还提出了一种基于深度 Q 网络的强化学习决策模型,该模型在模拟环境中进行训练,然后成功地在真实户外场景中验证其适用性。
May, 2024
本研究采用奖赏塑形和策略塑形技术同时训练 RL 智能体,以控制无人机;结果表明,与仅使用基于策略的方法训练智能体相比,使用两种技术同时训练的智能体获得了较低的回报,但训练期间达到了更低的执行时间和更少的离散度。
Dec, 2022
使用图像处理技术和简单的深度强化学习(Deep-RL)代理,无需使用复杂的卷积神经网络(CNN)或对比学习(CL),就可以追踪和识别水面结构以进行动态着陆,从而为无人机的主动感知做出了贡献。
Sep, 2022