通过层次学习和规划框架,利用试错和模型生成轨迹的方法,本研究通过在线无模型强化学习和预训练微调奖励机制来赋予飞行器在未知和部分可观察环境中适应敏捷性的能力,并在仿真和实际硬件验证中证明了该方法比常数敏捷度基准和替代方法在飞行效率和安全性方面的优势。
Mar, 2024
利用卷积神经网络直接映射原始图像到航点和所需速度的强鲁棒性生成,使用路径规划和控制系统生成短的、最小时间轨迹段,测试表明该方法能够在动态环境中准确和稳健地实现无人机的自主飞行,不需要昂贵的硬件和昂贵的图像处理,且比专业的人类驾驶员更加高效。
Jun, 2018
本文研究了如何使用单一相机感知环境,利用模仿学习技术训练控制器以适应无人机飞行方向,实现低空自主飞行并避开障碍物。
Nov, 2012
通过将模型驱动控制与基于学习的感知相结合,本研究提出了一种适用于未知场景下机器人导航的方法,实验结果表明,相比于几何映射和终端学习方法,该方法在处理复杂环境下的目标到达更加可靠和高效。本方法不依赖于对环境的详细、明确的 3D 地图,适用于低帧率,且具有良好的仿真到真实世界的泛化性能。
Mar, 2019
将强化学习和模仿学习有效性应用于基于视觉的自主无人机竞赛,通过直接处理视觉输入无需明确状态估计,我们提出了一种结合强化学习和模仿学习优势的新型训练框架,通过三个阶段的训练实现超越单独强化学习或模仿学习在仅使用视觉信息且无需明确状态估计的情况下驾驶四轴飞行器穿过赛道的优秀性能和鲁棒性。
使用图像处理技术和简单的深度强化学习(Deep-RL)代理,无需使用复杂的卷积神经网络(CNN)或对比学习(CL),就可以追踪和识别水面结构以进行动态着陆,从而为无人机的主动感知做出了贡献。
Sep, 2022
研究如何使安全关键的机器人(如无人机)应用强化学习来评估风险并做出风险感知决策;通过提出分布式强化学习框架实现自适应风险倾向策略,在模拟环境和真实场景下发现最有效的风险倾向是各不相同的,并且自适应风险倾向的代理表现较好。
Mar, 2022
提出了一种全新的端到端方法,利用卷积神经网络将嘈杂的传感观测直接映射到避撞轨迹,从而实现四旋翼的高速自主飞行。在模拟训练中,该方法可以实现从模拟到真实环境的零 - shot 迁移,成功地使四旋翼在森林、雪地、脱轨的火车和倒塌的建筑物等复杂环境中高速自主飞行,并优于传统方法。
Oct, 2021
研究了基于强化学习的互动感知系统在场景探索和物体搜索方面的应用,结果表明该方法不再需要预定义的启发式模型,可在模拟和现实世界中有效地解决这一任务。
Nov, 2019
通过学习深度的感知动作策略,使用对比学习从输入图像中提取固定特征表示,通过两阶段的作弊式学习框架训练神经网络策略,将视觉驱动的自主无人机竞赛问题转化为了提取原始图像的特征表示进行控制命令推断,无需全局一致的状态估计、轨迹规划和手工控制设计。该方法不仅可使控制策略更具有鲁棒性,而且可以实现与状态法相同的赛车性能,为开发纯靠图像输入控制无人机的智能视觉自主系统铺平了道路。
Oct, 2022