Aug, 2022

基于 Transformer 的场景表示学习增强强化学习用于自动驾驶决策

TL;DR本文提出了一种名为 Scene-Rep Transformer 的决策算法,使用改进后的场景表示编码和连续预测潜在蒸馏来提高强化学习决策能力,通过在 5 种具有挑战性的模拟城市场景中验证,演示了数据效率和成功率,安全性和效率等方面的实质性改进。