Oct, 2023

基于模型预测控制的高效强化学习的价值估计

TL;DR通过数据驱动方法,基于模型预测控制设计了一种改进的强化学习方法,该方法在经典数据库和无人机动态避障场景中实验结果验证了其高学习效率、更快的策略收敛速度以及需要更少的样本容量空间。