Jun, 2012

具有确定性观测的高斯过程赌博机的指数遗憾界

TL;DR通过分析高斯过程臂带问题,针对确定性观察结果,运用分支限定算法攻击了确定性情况并获得了更快的指数收敛率,显示出后悔随着时间推移而按高概率下降,估计呈现O(e ^ - tau * t / (ln t)^(d/4))的结果,其中d是搜索空间的维度,tau是目标函数在其全局最大值附近的行为所依赖的常数。