Oct, 2023

发展安全可个性化的自动驾驶车辆的偏好学习方法

TL;DR介绍了一种用于自动驾驶车辆的偏好学习方法,确保遵守交通规则。通过将描述交通规则的优先级顺序的信号时态逻辑(STL)公式纳入学习框架中,利用参数加权信号时态逻辑(PWSTL)将以成对比较为基础的安全保障偏好学习问题进行了形式化,并提出了一种解决此学习问题的方法。通过我们的方法给出的可行权重估值,得到了一个加权的 STL 公式,可用于正确且可定制的控制器综合。通过在涉及停车标志和行人横道的两个不同的模拟驾驶场景中进行人体实验研究,证明了我们方法的性能,与现有的偏好学习方法相比,在捕捉偏好方面取得了有竞争力的结果,并在关注安全性时明显优于其他方法。