Mar, 2025

基于大语言模型的车道合并控制的级联协作多智能体框架

TL;DR本研究解决了传统强化学习在多智能体场景中复制人类行为、有效泛化以及解释性问题的挑战,尤其是在深度环境理解、智能体协调和动态优化的需求下。提出了级联协作多智能体(CCMA)框架,结合个体交互的强化学习、经过微调的大语言模型的区域合作、全局优化的奖励函数以及动态优化决策的检索增强生成机制。实验结果表明,CCMA在复杂驾驶环境中显著超越了现有的强化学习方法,实现了微观和宏观性能上的重大提升。