Jun, 2024

AC4MPC: 基于演员 - 评论家强化学习的非线性模型预测控制

TL;DR利用演员 - 评论家强化学习技术提高模型预测控制性能,通过演员模型提供初始猜测解以及评论家模型对轨迹进行评估确定最佳控制方案。