Mar, 2024

RACE-SM: 基于强化学习的社交出口匝道合并的自主控制

TL;DR提出了一种基于学习的新型加速和换道决策模型,该模型明确考虑了自我车辆及周围车辆的效用,以产生社会可接受的行为。仿真结果表明,考虑周围车辆在奖励函数设计中的重要性,并直接考虑并道对周围车辆的影响,该模型在避免事故、近距离避开和反社会行为方面与文献中的模型相匹配或超过。