Feb, 2024

一种基于安全强化学习的权重变化模型预测控制方法用于自动驾驶车辆运动控制

TL;DR基于深度强化学习的多目标贝叶斯优化模型预测控制中,在运行过程中,通过限制强化学习动作空间在安全学习空间内,选择最优离散动作,并根据上下文选择相应的优化权重集合,使得未经训练的强化学习模型表现出安全且最优的性能,实验结果表明,训练后的模型展现了超越Pareto前沿的性能。