强化学习控制四轴飞行器

Jul, 2017

Control of a Quadrotor with Reinforcement Learning

Jemin Hwangbo, Inkyu Sa, Roland Siegwart, Marco Hutter

TL;DR本文介绍一种基于强化学习技术训练的神经网络控制四旋翼的方法，提出了一种新的、相对于现有算法更适用于控制四旋翼的学习算法，实验结果表明，该策略网络可以相对准确地对步阶响应做出反应，并且在非常恶劣的初始化情况下（手动向上扔，并具有 5m/s 的初始速度）也能够将四旋翼稳定悬停在空中，同时每个时间步的策略评估计算时间仅为 7μs。

Abstract

In this paper, we present a method to control a quadrotor with a neural network trained using reinforcement learning techniques. With rein

quadrotor neural network reinforcement learning control algorithm

发现论文，激发创造

Sim-to-(Multi)-Real: 将低层鲁棒控制策略转移到多个四旋翼上

使用强化学习训练神经网络，学习低级别的四轴飞行器控制策略，无需使用稳定的 PD 控制器，可以推广到多种四轴飞行器。

Mar, 2019

基于深层模型的强化学习学习飞行

通过学习无人机动力学的概率模型，我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器，完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。

Mar, 2020

使用神经网络学习四旋翼动力学以进行飞行控制

本文探讨使用基于神经网络的动力学模型来合成不同于训练的轨迹的控制，并在四旋翼试验台上进行了实验验证。

Oct, 2016

使用强化学习规划具有悬臂机器人的无人机执行器轨迹

我们研究了一种空中操纵系统，即装备有可控制自由度的无人机 (UAV) 和机械臂来进行飞行实施任务，该解决方案基于采用 Q 学习方法来控制机械臂末端即末端执行器的轨迹，并采用基于时间碰撞 (TTC) 的运动规划模型，在确保机械臂可达性的同时，使四旋翼无人机绕过障碍物。

Aug, 2023

利用模拟优化改进四旋翼零样本策略转移

本研究提出了一种数据驱动方法来优化模拟参数，实现从模拟到实际四旋翼的直接控制，通过强化学习的方式训练低级控制器需要比高级控制策略更精确的模拟。

Jan, 2022

秒学飞行

通过使用基于强化学习的异态 actor-critic 架构和高度可靠的基于强化学习的训练方法，本研究提出了一种新颖的无人机控制框架，能够在仅 18 秒的训练时间内实现从模拟环境到真实环境的快速转化，并能在廉价的、现成的无人机上实现实时控制。同时，本研究通过介绍控制抽象、非线性和领域参数的分类以及引入一个全新的课程学习和高度优化的模拟器，提高了样本的复杂度和训练时间，并通过与现有控制解决方案的实验比较，展示了该框架在航迹跟踪方面具有竞争性能。

Nov, 2023

基于强化学习的 CrazyFlie 2.X 四轴飞行器控制

本研究的目标是探索 PID 算法和强化学习算法之间的协同作用，以实现对 CrazyFlie 2.X 四旋翼的实用控制机制进行控制。首要目标是使用强化学习策略进行 PID 调整。次要目标是通过与灯塔定位系统集成来实现导航控制。

Jun, 2023

基于 MPC 引导的策略搜索学习自主飞行器深度控制策略

模型预测控制与强化学习相结合并在引导策略搜索框架下应用，通过使用机载传感器数据在训练时间内训练神经网络策略，该策略可成功地控制四旋翼飞行器的避障而无需系统完整状态知识。

Sep, 2015

四旋翼飞行器控制的自适应增益调度

本文通过使用强化学习技术 (Reinforcement Learning, RL) 来调整四旋翼控制器的控制增益，特别地，我们采用了近端策略优化 (Proximal Policy Optimization, PPO) 来训练一个根据实际情况调整控制增益的策略，其中主要目标是在跟随预定轨迹的同时最小化跟踪误差。本文的主要目的是分析自适应增益策略的有效性，并将其与静态增益控制算法的性能进行比较，使用积分平方误差和积分时间平方误差作为度量标准。结果表明，与静态增益控制器相比，自适应增益方案实现了超过 40% 的跟踪误差降低。

Mar, 2024

使用策略和奖励塑形的无人机控制强化学习

本研究采用奖赏塑形和策略塑形技术同时训练 RL 智能体，以控制无人机；结果表明，与仅使用基于策略的方法训练智能体相比，使用两种技术同时训练的智能体获得了较低的回报，但训练期间达到了更低的执行时间和更少的离散度。

Dec, 2022