Jul, 2019
非静态环境下的臂匠凸优化
Bandit Convex Optimization in Non-stationary Environments
Peng Zhao, Guanghui Wang, Lijun Zhang, Zhi-Hua Zhou
TL;DR探讨了分布不稳定的环境下,采用动态遗憾作为衡量标准的医生凸优化问题,并提出了一种新的算法,在不需要预知路径长度情况下,可以分别实现 $O (T^{3/4}(1+P_T)^{1/2})$ 和 $O (T^{1/2}(1+P_T)^{1/2})$ 的动态遗憾.