Mar, 2020

容忍腐败的高斯过程赌博优化

TL;DR使用高斯过程方法提出一种基于随机噪声反馈的未知非凸函数的优化算法 Fast-Slow GP-UCB,在考虑对抗性干扰的情况下,通过两个实例间的随机选择、扩大置信区间和悲观乐观法,提出了稳健性和非稳健性的区分的理论分析。