提出了一种全新的端到端方法,利用卷积神经网络将嘈杂的传感观测直接映射到避撞轨迹,从而实现四旋翼的高速自主飞行。在模拟训练中,该方法可以实现从模拟到真实环境的零 - shot 迁移,成功地使四旋翼在森林、雪地、脱轨的火车和倒塌的建筑物等复杂环境中高速自主飞行,并优于传统方法。
Oct, 2021
使用强化学习训练神经网络,学习低级别的四轴飞行器控制策略,无需使用稳定的 PD 控制器,可以推广到多种四轴飞行器。
Mar, 2019
小型四旋翼飞行器通过模拟得到的控制策略以及领域随机化和系统识别技术实现了成功的倒置降落行为,模拟了在苍蝇中观察到的行为。
Feb, 2024
通过学习无人机动力学的概率模型,我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器,完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。
Mar, 2020
利用卷积神经网络直接映射原始图像到航点和所需速度的强鲁棒性生成,使用路径规划和控制系统生成短的、最小时间轨迹段,测试表明该方法能够在动态环境中准确和稳健地实现无人机的自主飞行,不需要昂贵的硬件和昂贵的图像处理,且比专业的人类驾驶员更加高效。
Jun, 2018
通过学习深度的感知动作策略,使用对比学习从输入图像中提取固定特征表示,通过两阶段的作弊式学习框架训练神经网络策略,将视觉驱动的自主无人机竞赛问题转化为了提取原始图像的特征表示进行控制命令推断,无需全局一致的状态估计、轨迹规划和手工控制设计。该方法不仅可使控制策略更具有鲁棒性,而且可以实现与状态法相同的赛车性能,为开发纯靠图像输入控制无人机的智能视觉自主系统铺平了道路。
Oct, 2022
通过使用基于强化学习的异态 actor-critic 架构和高度可靠的基于强化学习的训练方法,本研究提出了一种新颖的无人机控制框架,能够在仅 18 秒的训练时间内实现从模拟环境到真实环境的快速转化,并能在廉价的、现成的无人机上实现实时控制。同时,本研究通过介绍控制抽象、非线性和领域参数的分类以及引入一个全新的课程学习和高度优化的模拟器,提高了样本的复杂度和训练时间,并通过与现有控制解决方案的实验比较,展示了该框架在航迹跟踪方面具有竞争性能。
Nov, 2023
本研究提出了一种数据驱动方法来优化模拟参数,实现从模拟到实际四旋翼的直接控制,通过强化学习的方式训练低级控制器需要比高级控制策略更精确的模拟。
Jan, 2022
本论文提出了一种适用于四轴飞行器的通用自适应控制器,基于神经网络,通过在仿真环境中训练实现快速适应各种扰动和硬件变化。
Sep, 2022
本文介绍一种基于强化学习技术训练的神经网络控制四旋翼的方法,提出了一种新的、相对于现有算法更适用于控制四旋翼的学习算法,实验结果表明,该策略网络可以相对准确地对步阶响应做出反应,并且在非常恶劣的初始化情况下(手动向上扔,并具有 5m/s 的初始速度)也能够将四旋翼稳定悬停在空中,同时每个时间步的策略评估计算时间仅为 7μs。
Jul, 2017