Apr, 2023

强化学习的鲁棒非线性设定点控制

TL;DR探讨三种方法来改进强化学习方法以支持高度非线性的设定点控制问题:1)利用先验反馈控制器支持幅度探索;2)使用积分误差;3)模型集训练。这些方法的组合可导致更高效的训练和更健壮的设定点控制器,可直接应用于真实世界中的非线性系统。