ICMLApr, 2022

使用无模型强化学习在安全驾驶情境中自动学习备用策略

TL;DR本文介绍了一种无模型的强化学习代理来捕捉环境中多种行为方式的方法,引入额外的伪奖励项来鼓励探索具有不同状态空间的区域,并将此应用于自动驾驶场景,以学习备用策略并展示其可行性。