使用神经网络学习四旋翼动力学以进行飞行控制

Oct, 2016

使用神经网络学习四旋翼动力学以进行飞行控制

Learning Quadrotor Dynamics Using Neural Network for Flight Control

Somil Bansal, Anayo K. Akametalu, Frank J. Jiang, Forrest Laine, Claire J. Tomlin

TL;DR本文探讨使用基于神经网络的动力学模型来合成不同于训练的轨迹的控制，并在四旋翼试验台上进行了实验验证。

Abstract

Traditional learning approaches proposed for controlling quadrotors or helicopters have focused on improving performance for specific trajectories by iteratively improving upon a nominal controller, for example learning from demonstrations, iterative learning, and reinforcement learning. In these schemes, however, it is not clear how the information gathered

quadrotor dynamics neural network control training

发现论文，激发创造

基于物理学思想的四旋翼动力学时态学习，用于准确的模型预测轨迹跟踪

本研究提出了一种基于物理启发的时间卷积网络（PI-TCN）方法，用于纯从机器人经验中学习四旋翼系统动力学，结合稀疏时间卷积和稠密前馈连接，挖掘四旋翼动力学的结构，并将物理约束嵌入训练过程，以实现网络的泛化能力，同时实现了精确的封闭环轨迹跟踪和预测控制，实验结果表明这是第一次成功将物理启发深度学习应用于时间卷积网络和系统识别任务。

Jun, 2022

神经降落器：使用学得动力学进行稳定的无人机降落控制

本文提出了一种基于深度学习的鲁棒非线性控制器，提高了四旋翼降落时的控制性能，并通过实验证明了该控制器在降落和横向轨迹跟踪方面均显著优于传统的非线性控制方法。

Nov, 2018

Sim-to-(Multi)-Real: 将低层鲁棒控制策略转移到多个四旋翼上

使用强化学习训练神经网络，学习低级别的四轴飞行器控制策略，无需使用稳定的 PD 控制器，可以推广到多种四轴飞行器。

Mar, 2019

强化学习控制四轴飞行器

本文介绍一种基于强化学习技术训练的神经网络控制四旋翼的方法，提出了一种新的、相对于现有算法更适用于控制四旋翼的学习算法，实验结果表明，该策略网络可以相对准确地对步阶响应做出反应，并且在非常恶劣的初始化情况下（手动向上扔，并具有 5m/s 的初始速度）也能够将四旋翼稳定悬停在空中，同时每个时间步的策略评估计算时间仅为 7μs。

Jul, 2017

基于深层模型的强化学习学习飞行

通过学习无人机动力学的概率模型，我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器，完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。

Mar, 2020

利用模拟优化改进四旋翼零样本策略转移

本研究提出了一种数据驱动方法来优化模拟参数，实现从模拟到实际四旋翼的直接控制，通过强化学习的方式训练低级控制器需要比高级控制策略更精确的模拟。

Jan, 2022

秒学飞行

通过使用基于强化学习的异态 actor-critic 架构和高度可靠的基于强化学习的训练方法，本研究提出了一种新颖的无人机控制框架，能够在仅 18 秒的训练时间内实现从模拟环境到真实环境的快速转化，并能在廉价的、现成的无人机上实现实时控制。同时，本研究通过介绍控制抽象、非线性和领域参数的分类以及引入一个全新的课程学习和高度优化的模拟器，提高了样本的复杂度和训练时间，并通过与现有控制解决方案的实验比较，展示了该框架在航迹跟踪方面具有竞争性能。

Nov, 2023

利用空中机器人群体协作深度强化学习方法学习在湍流中导航

本文研究了多飞行器在恶劣气流环境中的运动控制问题，并提出了一种基于深度强化学习和图形卷积神经网络的解决方法，能够帮助机器人团队实现更好的气流补偿和协同运动。

Jun, 2023

QuadSim：用于强化学习算法的四旋翼旋转动力学模拟框架

本研究旨在设计和开发一个数学基础的四旋翼旋转动态仿真框架，以测试强化学习算法在各种灵活的配置下的表现，该框架利用初值问题求解常微分方程（ODE）系统来模拟四旋翼的线性和非线性表现，并通过添加随机高斯噪声使仿真变得确定性 / 随机性，同时该框架还支持多进程并行运行。

Feb, 2022

四轴飞行器控制的基于混合 Actor-Critic 神经结构的自适应 PID 控制

本文探讨了使用基于强化学习的神经网络自整定的 PID 控制算法，应用于四旋翼飞行器的姿态和高度控制，在动态和静态增益的调整中使用了适应性动量（ADAM）优化器和反向传播（BP）算法，并证明该方法比具有恒定增益的 PID 控制器具有更好的性能。

Jul, 2023