Jul, 2024

通过基于表示的屏蔽增强部分隐藏城市交通环境下自主代理的安全性

TL;DR提出了一种以自主交通工具感知信息为中心的新型状态表示方法,通过强化学习实现安全导航,超过其他基准模型在安全和能耗度量方面的性能表现,同时保持了竞争力的平均行驶速度,为更健壮和可靠的自主导航策略铺平道路,从而实现更安全和高效的城市交通环境。