深度飞行器杂技

Jun, 2020

Deep Drone Acrobatics

Elia Kaufmann, Antonio Loquercio, René Ranftl, Matthias Müller, Vladlen Koltun...

TL;DR本文提出了一种基于模拟仿真的 sensorimotor 策略，让一个自主的 quadrotor 可以在没有真实数据的情况下飞行极限的特技动作，并且不需要人类专业知识的提供，且可以不经过细致微调直接部署到实际应用上。

Abstract

Performing acrobatic maneuvers with quadrotors is extremely challenging. Acrobatic flight requires high thrust and extreme angular accelerations that push the platform to its physical limits. Professional drone p

quadrotors acrobatic maneuvers sensorimotor policy simulation extreme flight

发现论文，激发创造

野外快速飞行学习

提出了一种全新的端到端方法，利用卷积神经网络将嘈杂的传感观测直接映射到避撞轨迹，从而实现四旋翼的高速自主飞行。在模拟训练中，该方法可以实现从模拟到真实环境的零 - shot 迁移，成功地使四旋翼在森林、雪地、脱轨的火车和倒塌的建筑物等复杂环境中高速自主飞行，并优于传统方法。

Oct, 2021

Sim-to-(Multi)-Real: 将低层鲁棒控制策略转移到多个四旋翼上

使用强化学习训练神经网络，学习低级别的四轴飞行器控制策略，无需使用稳定的 PD 控制器，可以推广到多种四轴飞行器。

Mar, 2019

从果蝇到机器人：具有动态停歇的小型四轴飞行器的倒立着陆

小型四旋翼飞行器通过模拟得到的控制策略以及领域随机化和系统识别技术实现了成功的倒置降落行为，模拟了在苍蝇中观察到的行为。

Feb, 2024

基于深层模型的强化学习学习飞行

通过学习无人机动力学的概率模型，我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器，完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。

Mar, 2020

深度无人机赛车：学习在动态环境中敏捷飞行

利用卷积神经网络直接映射原始图像到航点和所需速度的强鲁棒性生成，使用路径规划和控制系统生成短的、最小时间轨迹段，测试表明该方法能够在动态环境中准确和稳健地实现无人机的自主飞行，不需要昂贵的硬件和昂贵的图像处理，且比专业的人类驾驶员更加高效。

Jun, 2018

基于视觉的自主无人机赛车的深度感觉运动策略学习

通过学习深度的感知动作策略，使用对比学习从输入图像中提取固定特征表示，通过两阶段的作弊式学习框架训练神经网络策略，将视觉驱动的自主无人机竞赛问题转化为了提取原始图像的特征表示进行控制命令推断，无需全局一致的状态估计、轨迹规划和手工控制设计。该方法不仅可使控制策略更具有鲁棒性，而且可以实现与状态法相同的赛车性能，为开发纯靠图像输入控制无人机的智能视觉自主系统铺平了道路。

Oct, 2022

秒学飞行

通过使用基于强化学习的异态 actor-critic 架构和高度可靠的基于强化学习的训练方法，本研究提出了一种新颖的无人机控制框架，能够在仅 18 秒的训练时间内实现从模拟环境到真实环境的快速转化，并能在廉价的、现成的无人机上实现实时控制。同时，本研究通过介绍控制抽象、非线性和领域参数的分类以及引入一个全新的课程学习和高度优化的模拟器，提高了样本的复杂度和训练时间，并通过与现有控制解决方案的实验比较，展示了该框架在航迹跟踪方面具有竞争性能。

Nov, 2023

利用模拟优化改进四旋翼零样本策略转移

本研究提出了一种数据驱动方法来优化模拟参数，实现从模拟到实际四旋翼的直接控制，通过强化学习的方式训练低级控制器需要比高级控制策略更精确的模拟。

Jan, 2022

零样本自适应四轴飞行器控制器

本论文提出了一种适用于四轴飞行器的通用自适应控制器，基于神经网络，通过在仿真环境中训练实现快速适应各种扰动和硬件变化。

Sep, 2022

强化学习控制四轴飞行器

本文介绍一种基于强化学习技术训练的神经网络控制四旋翼的方法，提出了一种新的、相对于现有算法更适用于控制四旋翼的学习算法，实验结果表明，该策略网络可以相对准确地对步阶响应做出反应，并且在非常恶劣的初始化情况下（手动向上扔，并具有 5m/s 的初始速度）也能够将四旋翼稳定悬停在空中，同时每个时间步的策略评估计算时间仅为 7μs。

Jul, 2017