Aug, 2022

基于 Koopman 不变子空间的非线性动态杆位置控制数据驱动端到端学习

TL;DR本文提出了一种基于 Koopman 算符理论的数据驱动方法来控制黑盒非线性动态系统的频率和收敛速率,该方法利用一个策略网络来训练一个 Koopman 算符的特征值接近目标特征值,该策略网络由神经网络和极点配置模块组成,并使用增强学习以端到端的方式进行训练,结果表明该方法比无模型强化学习和基于模型的控制具有更好的性能。