OIL: 观测模仿学习

Mar, 2018

OIL: Observational Imitation Learning

Guohao Li, Matthias Müller, Vincent Casser, Neil Smith, Dominik L. Michels...

TL;DR提出了一种支持在线训练和自动选择最佳行为的新型模仿学习变体 ——OIL，应用于自动驾驶和无人机比赛的挑战性问题，使用 Sim4CV 仿真器进行大量合成训练数据的生成和在线学习和评估，并使用感知网络来预测路点和 OIL 来训练控件预测网络。实验表明，我们的训练网络在模拟中的表现优于其老师 / 人类以及传统的模仿学习和强化学习基线模型。

Abstract

Recent work has explored the problem of autonomous navigation by imitating a teacher and learning an end-to-end policy, which directly predicts controls from raw images. However, these approaches tend to be sensitive to mistakes by the teacher and do not scale well to other environment

observational imitation learning autonomous navigation online training sim4cv simulator perception network

发现论文，激发创造

使用端到端深度模仿学习的敏捷自主驾驶

我们提出了一种使用低成本传感器进行敏捷越野自主驾驶的端到端模仿学习系统，通过模仿配备高级传感器的模型预测控制器，我们训练了一个深度神经网络控制策略，将原始的高维观测映射到连续的转向和油门命令，这个方法不需要状态估计或实时规划来导航车辆，并通过在线模仿学习克服了协变量漂移方面的挑战，实现了成功的高速越野行驶，匹配了最新的性能水平。

Sep, 2017

基于条件仿真学习的城市驾驶控制

针对自主驾驶中手工制定决策规则的困难，利用易于收集的人类驾驶数据学习行为的能力，同时结合计算机视觉的语义、几何和运动表征，提出了一种基于条件模仿学习的端到端方法，使自动驾驶车辆能够在城区中跟随用户指定的路线，具备横向和纵向控制能力，并且在欧洲城市街道上行驶了 35 公里的新路线。

Nov, 2019

基于条件模仿学习的端到端驾驶

本文提出了一种基于高层指令输入的条件性模仿学习方法，使得经过训练的车辆在测试时间内仍然能够遵循导航指令，本文在仿真实验和机器人卡车实验中对各种条件性模仿学习架构进行了评估和实践。

Oct, 2017

城市环境下驾驶的有条件能力学习

该研究提出了一种基于直接感知的自主驾驶方法，在城市环境中能够根据高级方向输入进行自主导航，同时能够识别交通信号灯和速度标志，降低车辆事故率。

Jun, 2018

以关键帧为中心的视觉模仿学习

该研究提出了一种通过加强模仿的关键帧来改进模仿学习的方法，以在视觉模仿等现实场景中实现更好的性能表现，并在基于图像和基于视觉的控制任务中进行了验证。

Jun, 2021

利用相机和激光雷达数据进行自监督模仿学习的端到端驾驶

该论文提出了第一种无监督学习框架 self-supervised imitation learning (SSIL)，该框架可以在没有使用驾驶命令数据的情况下学习 E2E 驾驶网络，并且与监督学习对照组具有可比较的 E2E 驾驶准确性。

Aug, 2023

基于模拟的强化学习在基于视觉的敏捷飞行中的引导

将强化学习和模仿学习有效性应用于基于视觉的自主无人机竞赛，通过直接处理视觉输入无需明确状态估计，我们提出了一种结合强化学习和模仿学习优势的新型训练框架，通过三个阶段的训练实现超越单独强化学习或模仿学习在仅使用视觉信息且无需明确状态估计的情况下驾驶四轴飞行器穿过赛道的优秀性能和鲁棒性。

Mar, 2024

条件模仿学习和指令增强实现更安全的端到端自动驾驶

本研究提出了基于分离式概率潜变量模型来生成方向盘操控命令的新方法，以实现对自动驾驶汽车进行高层次控制的目的，并扩展了模型以训练对异常方向盘操控命令具有弹性的控制器，达到了在可靠性和可解释性方面均优于当今最先进的技术水平的目的。

Sep, 2019

泛化自驾车策略的模仿学习及模拟转现实

本文研究应用 Imitation Learning 和 transfer learning 方法解决 Duckietown 场景下的机器人车道跟踪问题，并通过 sim-to-real 方法进行实际环境迁移，最终比较了三种 Imitation Learning 方法和两种 sim-to-real 方法的优缺点。

Jun, 2022

AI 驾驶奥林匹克赛事中以模仿学习方法训练真实世界和仿真数据相结合

本文描述了赢得 AI 驾驶奥林匹克比赛车道追踪挑战的方法，该方法通过混合模拟和真实数据上的模仿学习实现。

Jul, 2020