Jun, 2018

自适应线性二次调节器

TL;DR本文旨在系统地解决三个问题:无法量化未知系统动态参数对后悔值的影响,现有的一些自适应控制策略的高效实现问题以及未完善的系统参数辨识问题;通过一种新的自适应控制策略分解方法,我们可以得到任意策略的后悔值与最优控制器之间的差距,证明了针对稍作修改的 CE 方案的自适应控制策略的高效性;并给出了不同级别的收敛速率来描述系统未知参数的标识可能性。