Sep, 2022

通过分析策略梯度训练高效控制器

TL;DR提出一种基于解析策略梯度法(APG)的控制方法来解决机器人系统控制问题,与 MPC 控制方法相比,该方法能够实现类似的轨迹跟踪性能,但计算时间要少一个数量级,在控制设计和优化领域有着极高的实际应用价值。