符号化模仿学习：从黑盒到可解释的驾驶策略

Sep, 2023

符号化模仿学习：从黑盒到可解释的驾驶策略

Symbolic Imitation Learning: From Black-Box to Explainable Driving Policies

Iman Sharifi, Saber Fallah

TL;DR当前的模仿学习方法在实现高效的驾驶策略从真实世界数据中获益，但在可解释性和泛化性方面存在显著限制。本文通过引入符号模仿学习（SIL）来解决这些限制，它利用归纳逻辑编程（ILP）来学习透明、可解释和泛化的驾驶策略。使用 real-world highD 数据集，我们对 SIL 方法进行了严格的比较分析，结果表明 SIL 不仅提高了驾驶策略的可解释性，而且在各种驾驶情况下显著提高了它们的适用性。因此，本研究为更可靠和更安全的自动驾驶系统提供了一条新途径，强调了将 ILP 整合到 IL 领域的潜力。

Abstract

Current methods of imitation learning (IL), primarily based on deep neural networks, offer efficient means for obtaining driving policies from real-world data but suffer from significant limitations in interpretability<

imitation learning interpretability generalizability symbolic imitation learning autonomous driving

发现论文，激发创造

命令式学习：机器人自主性的自我监督神经符号学习框架

通过引入自我监督的神经符号化 (NeSy) 计算框架，基于符号推理能力，本文提出了基于指令学习 (IL) 的新的面向机器人自主性的方法，克服了数据驱动方法在应对不断变化的环境中泛化能力差的问题，通过三个主要组件的循环学习，验证了其在路径规划、规则归纳、最优控制、视觉测距和多机器人路径规划等五个机器人自主性任务上的有效性，并预期其能够促进各个领域的进一步研究。

Jun, 2024

基于神经符号深度强化学习的安全自主驾驶政策

本研究介绍了一种名为 DRLSL 的新的神经符号模型自由深度强化学习方法，将深度强化学习与符号逻辑知识驱动推理相结合，可以在现实环境下实现安全学习，以实现自主驾驶政策，并可在训练和测试阶段成功避免不安全的行为，且比传统的深度强化学习方法更具有一般性和更快的收敛速度。

Jul, 2023

基于条件仿真学习的城市驾驶控制

针对自主驾驶中手工制定决策规则的困难，利用易于收集的人类驾驶数据学习行为的能力，同时结合计算机视觉的语义、几何和运动表征，提出了一种基于条件模仿学习的端到端方法，使自动驾驶车辆能够在城区中跟随用户指定的路线，具备横向和纵向控制能力，并且在欧洲城市街道上行驶了 35 公里的新路线。

Nov, 2019

灵活推理、规划和控制的深度仿真模型

本文提出了模仿模型方法，将模仿学习和目标导向规划相结合，使用概率预测模型生成解释性的专家级轨迹，以实现特定目标。在动态模拟自主驾驶任务中，我们的方法显著优于六种模仿学习方法和一种基于规划的方法，并可以从专家演示中高效地学习。此外，我们的方法对于目标规范不良的情况具有鲁棒性。

Oct, 2018

从原始数据学习答集程序的神经符号学习

本文介绍了一种名为 NSIL 的神经符号归纳学习方法，通过训练一个通用神经网络，从原始数据中提取潜在的概念，同时学习映射潜在概念与目标标签的符号知识，从而解决复杂决策问题。我们在三个不同复杂度的问题领域上评估了 NSIL，包括 NP 完全问题。结果表明，NSIL 学习到了表达丰富的符号知识，能够解决计算复杂的问题，并在准确性和数据效率方面取得了最先进的性能。

May, 2022

深层归纳逻辑编程与强化学习相遇

我们提出了一种将可区分的神经逻辑网络应用于关系强化学习领域，以解决动态连续环境中的问题。该模型更新了架构，使其能够在连续强化学习环境中解决问题，并通过引入非线性连续谓词来改进当前的归纳逻辑编程方法，允许关系强化学习代理在动态和连续的环境中进行推理和决策。

Aug, 2023

神经逻辑归纳学习：高效解释技能的学习

本研究提出了一种名为 “神经逻辑归纳学习” 的可微分归纳逻辑编程框架，通过学习可以解释数据模式的一阶逻辑规则，与现有的方法相比，具有更高的效率和可扩展性。

Oct, 2019

可解释的生成对抗拟态学习

提出了一种新颖的模仿学习方法，结合了信号时态逻辑（STL）推理和控制综合，能够明确地表示任务作为一个 STL 公式，在理解学习代理的具体任务方面提供了清晰的理解，并通过手动调整 STL 公式将人类知识纳入，以便适应新的场景。此外，我们采用了生成对抗网络（GAN）受启发的训练方法，既能进行推理，又能进行控制策略，有效地缩小了专家策略和学习策略之间的差距。通过两个案例研究，证明了我们算法的有效性，展示了其实际应用性和适应性。

Feb, 2024

神经符号层次规则归纳

提出一种高效、可解释的神经符号模型来解决归纳逻辑编程问题，并通过实验验证其性能。

Dec, 2021

泛化自驾车策略的模仿学习及模拟转现实

本文研究应用 Imitation Learning 和 transfer learning 方法解决 Duckietown 场景下的机器人车道跟踪问题，并通过 sim-to-real 方法进行实际环境迁移，最终比较了三种 Imitation Learning 方法和两种 sim-to-real 方法的优缺点。

Jun, 2022