May, 2023

面向参数变化系统的模型自适应强化学习控制中的样本高效迁移

TL;DR本文利用模型控制的思想解决了强化学习算法的样本效率问题,并通过四个基准实例验证了其性能。