在希尔伯特空间中改进的自标准化集中度：GP-UCB 的次线性遗憾

Jul, 2023

在希尔伯特空间中改进的自标准化集中度：GP-UCB 的次线性遗憾

Improved Self-Normalized Concentration in Hilbert Spaces: Sublinear Regret for GP-UCB

Justin Whitehouse, Zhiwei Steven Wu, Aaditya Ramdas

TL;DR本文解决了若干向来未解的开放性问题，提供了超线性收敛速度，证明了 GP-UCB 算法在大多数流行核函数上具有最优回报，且证明了简化版本的自标准化集中不等式和超鞅技术是关键技术工具。

Abstract

In the kernelized bandit problem, a learner aims to sequentially compute the optimum of a function lying in a reproducing kernel Hilbert space given only noisy evaluations at sequentially chosen points. In particular, the learner aims to minimize →

kernelized bandit problem regret gaussian process upper confidence bound algorithm matern kernel supermartingale techniques

发现论文，激发创造

赌赢型高斯过程优化：无悔与实验设计

通过多臂赌博机问题和高斯过程来解决在优化一个未知、嘈杂及难以评估的函数的问题。我们在这个问题上得到了遗憾界，建立了高斯过程优化和实验设计之间的联系。通过实验，我们证明了 GP-UCB 可以优于其他启发式高斯过程优化方法。

Dec, 2009

GP-UCB 的遗憾最优性

高斯过程最大上界置信（GP-UCB）是一个优化带噪声观测的黑盒函数的最受欢迎的方法之一，本文首次肯定地回答了在贝叶斯优化文献中的一个重要开放问题，即 GP-UCB 的遗憾是否是最优的，并提出了在目标函数具有某种平滑性质时 GP-UCB 的简单和累积遗憾的新上界，与具有相同平滑性质的优化函数的已知最小 - 最大下界匹配。

Dec, 2023

Matérn 核 RKHS 函数的采样优化

我们考虑在具有 Matern 核的再生核希尔伯特空间（RKHS）中优化函数的问题，该核的光滑度参数为 ν，域为 [0,1]^d，在带有噪声的强化学习反馈下，我们提出了第一个实用的算法，即 π-GP-UCB 算法，对于所有 ν> 1 和 d≥1 都具有保证的子线性遗憾。经验证明，与其前身改进的 GP-UCB 相比，性能更好，计算可扩展性大大提高。

Jan, 2020

量子贝叶斯优化

通过引入量子高斯过程 - 置信上界（Q-GP-UCB）算法，我们得到了第一个 BO 算法，可以在经典设置中将遗憾上界压缩为 O（对数多项式级别的 T），明显小于其遗憾下界 Omega（sqrt（T））。

Oct, 2023

容忍腐败的高斯过程赌博优化

使用高斯过程方法提出一种基于随机噪声反馈的未知非凸函数的优化算法 Fast-Slow GP-UCB，在考虑对抗性干扰的情况下，通过两个实例间的随机选择、扩大置信区间和悲观乐观法，提出了稳健性和非稳健性的区分的理论分析。

Mar, 2020

在 RKHS 中对光滑函数进行多尺度零阶优化

提出一种新算法，通过在通用高斯过程代理模型中增加本地多项式估计函数 $f$ 来构建多尺度 UCB 以指导优化器的搜索，从而在预算 $n$ 的情况下获得理论上的累积失望次数界限。

May, 2020

高斯过程赌博中的信息增益与遗憾界限

研究连续性赌博机问题下高斯过程与多种学习算法（GP-UCB、GP-TS）的误差性能，通过独立的贝叶斯和频率学派来分析多项式差距，得出了均价核的特殊化，进一步提高了误差性能。

Sep, 2020

重尾利润下的贝叶斯优化

本文通过对高斯过程黑盒优化中噪音模型的研究，提出了一种可用于重尾噪音的、基于核函数的 UCB 算法以及基于核函数近似的贝叶斯优化算法，解决了现有算法在重尾噪音下表现较差的问题，并在人造和真实数据集上验证了算法性能。

Sep, 2019

误设的高斯过程贝叶斯优化

本文提出了两种基于高斯过程（GP）方法的算法：一种乐观的 EC-GP-UCB 算法，另一种是一种消除型算法 Phased GP Uncertainty Sampling。本文给出了算法的上界，其依赖于时间长度和核心参数，证明了我们的算法在不知道错误情况下实现了对 ε 的最优依赖性，并证明了 EC-GP-UCB 可以与后悔边界平衡策略相结合。

Nov, 2021

核化多臂赌博机

本文提出了两种基于高斯过程的算法 - 改进的 GP-UCB（IGP-UCB）和 GP-Thomson 采样（GP-TS），并给出了相应的遗憾边界，在连续的臂集上解决了随机赌徒问题。当期望奖励函数属于复制核希尔伯特空间（RKHS）时，边界成立。在实验评估和对合成和真实世界环境中现有算法的比较中，突出了所提出策略的优势。

Apr, 2017