Dec, 2023

基于贝叶斯设置的组合高斯过程赌臂问题:理论与能效导航应用

TL;DR研究探究了具有时间变化的臂可用性的组合高斯过程半 - 算法问题,提出了三种基于高斯过程的算法 (即 GP-UCB、Bayes-GP-UCB 和 GP-TS) 的贝叶斯遗憾界,对综合合成和实际路网进行了实验研究,并发现上下文高斯过程模型在先验信息的信息度量上的遗憾值较低。