使用神经网络学习四旋翼动力学以进行飞行控制
本研究提出了一种基于物理启发的时间卷积网络(PI-TCN)方法,用于纯从机器人经验中学习四旋翼系统动力学,结合稀疏时间卷积和稠密前馈连接,挖掘四旋翼动力学的结构,并将物理约束嵌入训练过程,以实现网络的泛化能力,同时实现了精确的封闭环轨迹跟踪和预测控制,实验结果表明这是第一次成功将物理启发深度学习应用于时间卷积网络和系统识别任务。
Jun, 2022
本文提出了一种基于深度学习的鲁棒非线性控制器,提高了四旋翼降落时的控制性能,并通过实验证明了该控制器在降落和横向轨迹跟踪方面均显著优于传统的非线性控制方法。
Nov, 2018
使用强化学习训练神经网络,学习低级别的四轴飞行器控制策略,无需使用稳定的 PD 控制器,可以推广到多种四轴飞行器。
Mar, 2019
本文介绍一种基于强化学习技术训练的神经网络控制四旋翼的方法,提出了一种新的、相对于现有算法更适用于控制四旋翼的学习算法,实验结果表明,该策略网络可以相对准确地对步阶响应做出反应,并且在非常恶劣的初始化情况下(手动向上扔,并具有 5m/s 的初始速度)也能够将四旋翼稳定悬停在空中,同时每个时间步的策略评估计算时间仅为 7μs。
Jul, 2017
通过学习无人机动力学的概率模型,我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器,完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。
Mar, 2020
通过使用基于强化学习的异态 actor-critic 架构和高度可靠的基于强化学习的训练方法,本研究提出了一种新颖的无人机控制框架,能够在仅 18 秒的训练时间内实现从模拟环境到真实环境的快速转化,并能在廉价的、现成的无人机上实现实时控制。同时,本研究通过介绍控制抽象、非线性和领域参数的分类以及引入一个全新的课程学习和高度优化的模拟器,提高了样本的复杂度和训练时间,并通过与现有控制解决方案的实验比较,展示了该框架在航迹跟踪方面具有竞争性能。
Nov, 2023
本文研究了多飞行器在恶劣气流环境中的运动控制问题,并提出了一种基于深度强化学习和图形卷积神经网络的解决方法,能够帮助机器人团队实现更好的气流补偿和协同运动。
Jun, 2023
本研究旨在设计和开发一个数学基础的四旋翼旋转动态仿真框架,以测试强化学习算法在各种灵活的配置下的表现,该框架利用初值问题求解常微分方程(ODE)系统来模拟四旋翼的线性和非线性表现,并通过添加随机高斯噪声使仿真变得确定性 / 随机性,同时该框架还支持多进程并行运行。
Feb, 2022
本文探讨了使用基于强化学习的神经网络自整定的 PID 控制算法,应用于四旋翼飞行器的姿态和高度控制,在动态和静态增益的调整中使用了适应性动量(ADAM)优化器和反向传播(BP)算法,并证明该方法比具有恒定增益的 PID 控制器具有更好的性能。
Jul, 2023