Aug, 2024

交通专业知识与剩余强化学习相结合:知识驱动的基于模型的剩余强化学习用于CAV轨迹控制

TL;DR本研究解决了模型基强化学习在复杂环境中准确建模的挑战,提出了一种知识驱动的模型基剩余强化学习框架,以提升学习效率。通过将交通专家知识融入虚拟环境模型,本方法显著改善了CAV轨迹控制任务中的学习效率和政策优化,实现了比基线代理更优的表现。