Jul, 2023

基于神经符号深度强化学习的安全自主驾驶政策

TL;DR本研究介绍了一种名为 DRLSL 的新的神经符号模型自由深度强化学习方法,将深度强化学习与符号逻辑知识驱动推理相结合,可以在现实环境下实现安全学习,以实现自主驾驶政策,并可在训练和测试阶段成功避免不安全的行为,且比传统的深度强化学习方法更具有一般性和更快的收敛速度。