Sep, 2022

基于元强化学习的二阶系统自适应控制

TL;DR本研究采用 meta-RL 控制策略,结合模型基于信息离线培训,通过已知系统的动态规律 (parameters) 来自动适应过程的变化,实现对一、二阶系统的调节。