Sep, 2020

高斯过程赌博中的信息增益与遗憾界限

TL;DR研究连续性赌博机问题下高斯过程与多种学习算法(GP-UCB、GP-TS)的误差性能,通过独立的贝叶斯和频率学派来分析多项式差距,得出了均价核的特殊化,进一步提高了误差性能。