Jun, 2023

非线性系统中基于模型的 RL 的最优探索

TL;DR本研究针对非线性动态系统的控制问题,提出了一种通过最小化控制器损失和在任意系统中都能达到最佳实例速率的算法,该算法通过策略优化来实现优化实验设计,从而降低系统的参数不确定性。