基于神经符号深度强化学习的安全自主驾驶政策

Jul, 2023

基于神经符号深度强化学习的安全自主驾驶政策

Towards Safe Autonomous Driving Policies using a Neuro-Symbolic Deep Reinforcement Learning Approach

Iman Sharifi, Mustafa Yildirim, Saber Fallah

TL;DR本研究介绍了一种名为 DRLSL 的新的神经符号模型自由深度强化学习方法，将深度强化学习与符号逻辑知识驱动推理相结合，可以在现实环境下实现安全学习，以实现自主驾驶政策，并可在训练和测试阶段成功避免不安全的行为，且比传统的深度强化学习方法更具有一般性和更快的收敛速度。

Abstract

The dynamic nature of driving environments and the presence of diverse road users pose significant challenges for decision-making in autonomous driving. deep reinforcement learning (DRL) has emerged as a popular

autonomous driving deep reinforcement learning neuro-symbolic real-world safety

发现论文，激发创造

深度符号强化学习

该研究提出了一个神经和符号端到端强化学习架构，能够克服当前深度学习技术的局限性，如需要非常大的数据集工作、难以实现高级认知功能和透明性欠佳等。研究者以简单的视频游戏为例，展示了这个架构的实现原型，结果表明它能够有效地学习，并通过获得一组符号规则，可将性能提高到比传统完全神经强化学习系统更好的水平。

Sep, 2016

自主驾驶的深度强化学习：一份综述

本文综述了深度强化学习算法在自动驾驶任务上的应用，包括分类、验证、测试和强化现有强化学习算法解决方案的方法，还介绍了相关领域和挑战。

Feb, 2020

深度可解释关系强化学习：神经符号方法

提出了一种新的框架 Deep Explainable Relational Reinforcement Learning (DERRL)，它结合了神经网络和符号世界的优势来提取可解释的策略。通过在倒计时游戏、积木世界、网格世界和交通等不同环境中的实验证明，DERRL 可以适用于不同的配置和情境，从而具有通用性。

Apr, 2023

神经逻辑强化学习

本文提出了一种名为神经逻辑强化学习（NLRL）的新算法，基于策略梯度方法和可微分归纳逻辑编程，通过一阶逻辑来表示强化学习中的策略，解决了深度神经网络难以解释和学习泛化能力低的问题。实验表明，该算法可以在不同的环境下归纳出解释性强且性能接近最优的策略。

Apr, 2019

一阶逻辑中的神经符号强化学习

为了在文本角色扮演游戏中实现快速收敛和可解释的知识表示，我们提出了一种新的基于逻辑神经网络的强化学习方法，该方法可以从文本观察中提取一阶逻辑事实并使用逻辑算子训练策略，实验结果表明该方法比其他基于神经元符号框架的方法更快收敛。

Oct, 2021

神经符号元强化先行学习在非静态环境中实现安全的自动驾驶

该研究介绍了一种基于神经符号元强化前瞻学习（NUMERLA）的在线元强化学习算法，采用前瞻更新机制实现了自动驾驶模型在非稳态城市人车交互场景下的实时适应性和安全性。

Sep, 2023

SDRL：利用符号计划的可解释且数据高效的深度强化学习

该研究提出了一种符号深度强化学习（SDRL）框架，该框架通过引入符号规划来实现任务层面的可解释性，并运用计划器 - 控制器 - 元控制器架构进行子任务调度、数据驱动子任务学习和子任务评估，实现与长期规划能力、符号知识以及直接从高维感官输入进行端到端强化学习的优点相结合，并在实验结果中证实了子任务可解释性与与现有技术相比的数据效率改进。

Oct, 2018

符号化模仿学习：从黑盒到可解释的驾驶策略

当前的模仿学习方法在实现高效的驾驶策略从真实世界数据中获益，但在可解释性和泛化性方面存在显著限制。本文通过引入符号模仿学习（SIL）来解决这些限制，它利用归纳逻辑编程（ILP）来学习透明、可解释和泛化的驾驶策略。使用 real-world highD 数据集，我们对 SIL 方法进行了严格的比较分析，结果表明 SIL 不仅提高了驾驶策略的可解释性，而且在各种驾驶情况下显著提高了它们的适用性。因此，本研究为更可靠和更安全的自动驾驶系统提供了一条新途径，强调了将 ILP 整合到 IL 领域的潜力。

Sep, 2023

DRNet：基于深度强化学习的自动车道变更决策方法

机器学习在自主驾驶车辆的决策制定中优于许多基于规则的方法，我们通过提出一种基于强化学习的框架 'DRNet'，使用深度强化学习 (DRL) 来改进车道切换，并结合安全验证来确保只选择安全动作。

Nov, 2023

城市自主驾驶的无模型深度强化学习

本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架，并在高清晰度驾驶模拟器中进行了验证。结果表明，与基线相比，我们的方法可以很好地解决任务，且表现显著优异。

Apr, 2019