Mar, 2024

使用潜在状态推断的强化学习在观测时延下的自主匝道合并

TL;DR本研究介绍了一种解决自主加入匝道的问题的新方法,其中自动驾驶车辆需要无缝地融入多车道高速公路上的车流。我们引入了Lane-keeping,Lane-changing with Latent-state Inference和Safety Controller (L3IS)代理,旨在在没有关于周围车辆意图或驾驶风格的全面知识的情况下安全地执行匝道合流任务。我们还介绍了这种代理的增强型称为AL3IS,它考虑了观测延迟,允许代理在具有车辆间通信延迟的真实环境中做出更稳健的决策。通过对环境的隐含状态进行建模,如其他驾驶员的意图,我们的方法增强了代理适应动态交通状况、优化合流动作并确保与其他车辆的安全交互的能力。我们通过基于真实交通数据生成的广泛模拟来证明我们方法的有效性,并将其性能与现有方法进行比较。在基于真实美国101高速公路数据生成的具有挑战性的匝道合流案例中,L3IS显示出99.90%的成功率。我们进一步对AL3IS进行了灵敏度分析,评估其对不同观测延迟的鲁棒性,结果表明在1秒的车辆间通信延迟下,取得了93.84%的成功率,性能令人满意。