Jun, 2024

多智能体深度强化学习中的协作决策方法:混合 Q 学习用于变道

TL;DR本文提出了一种名为 MQLC 的方法,它通过整合混合价值 Q 网络,同时考虑集体和个体效益,以解决自主车辆路径规划中的车道变换决策问题。通过在观察中整合基于深度学习的意图识别模块并加强决策网络,使多主体系统能够有效地学习并制定最佳决策策略,从而显著提高车道变换的安全性和速度。