Nov, 2019

非随机控制问题

TL;DR该研究提出了一种针对未知线性动态系统进行控制的方法,能够对抗敌意干扰和对抗凸损失功能,通过衡量后效性的最佳线性策略,实现更高效的算法,并在此设定下保证次线性的遗憾边界 T^{2/3}。