Sep, 2023

符号化模仿学习:从黑盒到可解释的驾驶策略

TL;DR当前的模仿学习方法在实现高效的驾驶策略从真实世界数据中获益,但在可解释性和泛化性方面存在显著限制。本文通过引入符号模仿学习(SIL)来解决这些限制,它利用归纳逻辑编程(ILP)来学习透明、可解释和泛化的驾驶策略。使用 real-world highD 数据集,我们对 SIL 方法进行了严格的比较分析,结果表明 SIL 不仅提高了驾驶策略的可解释性,而且在各种驾驶情况下显著提高了它们的适用性。因此,本研究为更可靠和更安全的自动驾驶系统提供了一条新途径,强调了将 ILP 整合到 IL 领域的潜力。