追踪侵入者：一种用于追踪入侵无人机的强化学习方法

Sep, 2023

追踪侵入者：一种用于追踪入侵无人机的强化学习方法

Chasing the Intruder: A Reinforcement Learning Approach for Tracking Intruder Drones

Shivam Kainth, Subham Sahoo, Rajtilak Pal, Shashi Shekhar Jha

TL;DR使用增强学习和计算机视觉技术以及策略学习框架，基于追踪无人机的驱逐无人机，提出了一种鉴别和追踪入侵者无人机的方法。

Abstract

drones are becoming versatile in a myriad of applications. This has led to the use of drones for spying and intruding into the restricted or private air spaces. Such foul use of drone technology is dangerous for

drones reinforcement learning intruder drone computer vision policy learning

发现论文，激发创造

一种用于无人机自主降落平台的深度强化学习策略

本文阐述了如何将深度强化学习算法应用于机器人领域，主要关注于以物理模拟平台为基础的无人机飞行任务控制，使用基于 Gazebo 的强化学习框架进行训练，最终成功实现了无人机自主降落的任务

Sep, 2022

自主无人机导航的强化学习应用：系统综述

该研究探讨了使用强化学习算法解决无人机导航问题，讨论了不同环境下的算法特性和选择，并提出未来的研究方向。

Aug, 2022

自主飞行器基于深度强化学习的长期规划

本文研究了基于现实生活中无人机赛事的长期规划场景，对使用 PPO 算法训练的强化学习智能体在无人机比赛中与使用传统路径规划算法的模拟无人机进行了实验，使用对手无人机的 GPS 信息作为专家指导进行训练，成功解决了复杂状态空间问题，其代码可以在我们的 GitHub 存储库中找到。

Jul, 2020

使用策略和奖励塑形的无人机控制强化学习

本研究采用奖赏塑形和策略塑形技术同时训练 RL 智能体，以控制无人机；结果表明，与仅使用基于策略的方法训练智能体相比，使用两种技术同时训练的智能体获得了较低的回报，但训练期间达到了更低的执行时间和更少的离散度。

Dec, 2022

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020

自适应风险倾向：基于分布式强化学习的纳米无人机在杂乱环境下的导航

研究如何使安全关键的机器人（如无人机）应用强化学习来评估风险并做出风险感知决策；通过提出分布式强化学习框架实现自适应风险倾向策略，在模拟环境和真实场景下发现最有效的风险倾向是各不相同的，并且自适应风险倾向的代理表现较好。

Mar, 2022

用无人机进行时关紧急野外搜救的深度强化学习

该论文探讨在野外环境中为无人机创建高效的搜索任务的深度强化学习方法，通过利用先验数据和概率分布图，学习最优的飞行路径以快速找到失踪者，实验结果表明，与传统覆盖规划和搜索规划算法相比，深度强化学习方法在搜索时间上取得了显著改进。

May, 2024

无人机安全多智能体运动规划中的不确定性下滤波强化学习

我们提出一种可行的、基于强化学习和约束控制轨迹规划的无人机多智能体安全运动规划器，可以处理不确定的、杂乱的工作空间，并确保安全性、避免碰撞。该方法能够实时实施，相对于仅基于学习的方法，训练过程更简单，数值模拟和实验证明了该方法的有效性。

Oct, 2023

基于视觉的自主无人机赛车的深度感觉运动策略学习

通过学习深度的感知动作策略，使用对比学习从输入图像中提取固定特征表示，通过两阶段的作弊式学习框架训练神经网络策略，将视觉驱动的自主无人机竞赛问题转化为了提取原始图像的特征表示进行控制命令推断，无需全局一致的状态估计、轨迹规划和手工控制设计。该方法不仅可使控制策略更具有鲁棒性，而且可以实现与状态法相同的赛车性能，为开发纯靠图像输入控制无人机的智能视觉自主系统铺平了道路。

Oct, 2022

基于可解释的深度强化学习的无人机导航与规划中的鲁棒性对抗攻击检测

采用可解释的深度学习方法为指导和规划的无人机构建了一个仿真环境，其中包括障碍和对抗性攻击，并建立了对此的对抗性攻击检测器

Jun, 2022