本文阐述了如何将深度强化学习算法应用于机器人领域,主要关注于以物理模拟平台为基础的无人机飞行任务控制,使用基于 Gazebo 的强化学习框架进行训练,最终成功实现了无人机自主降落的任务
Sep, 2022
该研究探讨了使用强化学习算法解决无人机导航问题,讨论了不同环境下的算法特性和选择,并提出未来的研究方向。
Aug, 2022
本文研究了基于现实生活中无人机赛事的长期规划场景,对使用 PPO 算法训练的强化学习智能体在无人机比赛中与使用传统路径规划算法的模拟无人机进行了实验,使用对手无人机的 GPS 信息作为专家指导进行训练,成功解决了复杂状态空间问题,其代码可以在我们的 GitHub 存储库中找到。
Jul, 2020
本研究采用奖赏塑形和策略塑形技术同时训练 RL 智能体,以控制无人机;结果表明,与仅使用基于策略的方法训练智能体相比,使用两种技术同时训练的智能体获得了较低的回报,但训练期间达到了更低的执行时间和更少的离散度。
Dec, 2022
该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据,以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制,从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束,在各种场景参数下做出运动决策。
研究如何使安全关键的机器人(如无人机)应用强化学习来评估风险并做出风险感知决策;通过提出分布式强化学习框架实现自适应风险倾向策略,在模拟环境和真实场景下发现最有效的风险倾向是各不相同的,并且自适应风险倾向的代理表现较好。
Mar, 2022
该论文探讨在野外环境中为无人机创建高效的搜索任务的深度强化学习方法,通过利用先验数据和概率分布图,学习最优的飞行路径以快速找到失踪者,实验结果表明,与传统覆盖规划和搜索规划算法相比,深度强化学习方法在搜索时间上取得了显著改进。
May, 2024
我们提出一种可行的、基于强化学习和约束控制轨迹规划的无人机多智能体安全运动规划器,可以处理不确定的、杂乱的工作空间,并确保安全性、避免碰撞。该方法能够实时实施,相对于仅基于学习的方法,训练过程更简单,数值模拟和实验证明了该方法的有效性。
Oct, 2023
通过学习深度的感知动作策略,使用对比学习从输入图像中提取固定特征表示,通过两阶段的作弊式学习框架训练神经网络策略,将视觉驱动的自主无人机竞赛问题转化为了提取原始图像的特征表示进行控制命令推断,无需全局一致的状态估计、轨迹规划和手工控制设计。该方法不仅可使控制策略更具有鲁棒性,而且可以实现与状态法相同的赛车性能,为开发纯靠图像输入控制无人机的智能视觉自主系统铺平了道路。
Oct, 2022
采用可解释的深度学习方法为指导和规划的无人机构建了一个仿真环境,其中包括障碍和对抗性攻击,并建立了对此的对抗性攻击检测器
Jun, 2022