Jul, 2020

线性动态系统的黑箱控制

TL;DR研究使用单个黑盒交互控制未知的线性时不变动态系统的问题,探讨在线非随机控制的情况下如何获得次线性后悔量,该方法可处理对抗性干扰及凸损失函数的变化。我们提供了一种新的系统识别方法,并在一些条件下给出了后悔上界以及结果的匹配性下界。