Jan, 2020
Matérn核RKHS函数的采样优化
Bandit optimisation of functions in the Matérn kernel RKHS
TL;DR我们考虑在具有Matern核的再生核希尔伯特空间(RKHS)中优化函数的问题,该核的光滑度参数为ν,域为[0,1]^d,在带有噪声的强化学习反馈下,我们提出了第一个实用的算法,即π-GP-UCB算法,对于所有ν> 1和d≥1都具有保证的子线性遗憾。经验证明,与其前身改进的GP-UCB相比,性能更好,计算可扩展性大大提高。