ICMLFeb, 2021

高斯过程赌博机中的宽容后悔和良好动作识别

TL;DR研究了松弛优化条件下高斯过程逐步优化中的概率波段问题,提出了一些新的算法,证明了其上限,并为其提供了一些具有算法独立性的下限,此外还考虑了寻找单个 “良好行动” 的实际问题,并在此基础上提出了几种能比标准优化方法更快地找到 “良好行动” 的算法。