时变高斯过程贝叶斯优化

Jan, 2016

Time-Varying Gaussian Process Bandit Optimization

Ilija Bogunovic, Jonathan Scarlett, Volkan Cevher

TL;DR本文考虑带有 Bandit 反馈的序贝叶斯优化问题，采用了允许奖励函数随时间变化的公式。我们使用高斯过程对奖励函数进行建模，并介绍了高斯过程 UCB 算法的两个自然扩展。我们的主要贡献是这些算法的新颖遗憾界，提供了时间跨度和函数变化率之间权衡的明确刻画。我们在合成数据和实际数据上展示了算法的性能，并发现 TV-GP-UCB 的逐渐遗忘效果比 R-GP-UCB “尖锐重置” 更好，而且两种算法都显著优于传统的高斯过程 UCB 算法，因为它将陈旧数据和新数据视为平等。

Abstract

We consider the sequential bayesian optimization problem with bandit feedback, adopting a formulation that allows for the reward function to vary with time. We model the reward function using a gaussian process w

bayesian optimization gaussian process markov model regret bounds bandit feedback

发现论文，激发创造

赌赢型高斯过程优化：无悔与实验设计

通过多臂赌博机问题和高斯过程来解决在优化一个未知、嘈杂及难以评估的函数的问题。我们在这个问题上得到了遗憾界，建立了高斯过程优化和实验设计之间的联系。通过实验，我们证明了 GP-UCB 可以优于其他启发式高斯过程优化方法。

Dec, 2009

核化多臂赌博机

本文提出了两种基于高斯过程的算法 - 改进的 GP-UCB（IGP-UCB）和 GP-Thomson 采样（GP-TS），并给出了相应的遗憾边界，在连续的臂集上解决了随机赌徒问题。当期望奖励函数属于复制核希尔伯特空间（RKHS）时，边界成立。在实验评估和对合成和真实世界环境中现有算法的比较中，突出了所提出策略的优势。

Apr, 2017

高斯过程赌博中的信息增益与遗憾界限

研究连续性赌博机问题下高斯过程与多种学习算法（GP-UCB、GP-TS）的误差性能，通过独立的贝叶斯和频率学派来分析多项式差距，得出了均价核的特殊化，进一步提高了误差性能。

Sep, 2020

误设的高斯过程贝叶斯优化

本文提出了两种基于高斯过程（GP）方法的算法：一种乐观的 EC-GP-UCB 算法，另一种是一种消除型算法 Phased GP Uncertainty Sampling。本文给出了算法的上界，其依赖于时间长度和核心参数，证明了我们的算法在不知道错误情况下实现了对 ε 的最优依赖性，并证明了 EC-GP-UCB 可以与后悔边界平衡策略相结合。

Nov, 2021

使用高斯过程在 Bandit 环境下进行最优化估计

本文研究了一种直接利用未知函数 argmax 估计值的优化策略，并与 GP-UCB 和 GP-PI 策略建立了紧密联系。该方法的自动适应调整探索和利用的权衡，在机器人和视觉任务的广泛实证评估中表现出鲁棒性，通过性能 - 遗憾的界限说明了自适应调整的效果。

Oct, 2015

随机高斯过程上置信区间的贝叶斯优化

为了提高贝叶斯优化的性能，我们开发了一种改进的高斯过程 UCB 采集函数。通过从一个分布中采样探索开发权衡参数，我们证明这允许期望的权衡参数能更好地适应问题而不会影响函数贝叶斯遗憾的约束，并提供结果表明我们的方法在一系列真实和合成问题中比 GP-UCB 获得了更好的性能。

Jun, 2020

容忍腐败的高斯过程赌博优化

使用高斯过程方法提出一种基于随机噪声反馈的未知非凸函数的优化算法 Fast-Slow GP-UCB，在考虑对抗性干扰的情况下，通过两个实例间的随机选择、扩大置信区间和悲观乐观法，提出了稳健性和非稳健性的区分的理论分析。

Mar, 2020

量子贝叶斯优化

通过引入量子高斯过程 - 置信上界（Q-GP-UCB）算法，我们得到了第一个 BO 算法，可以在经典设置中将遗憾上界压缩为 O（对数多项式级别的 T），明显小于其遗憾下界 Omega（sqrt（T））。

Oct, 2023

多保真度高斯过程贝叶斯优化

在支持多精度的贝叶斯优化中，MF-GP-UCB 方法可显着提高性能并降低遗憾值

Mar, 2016

GP-UCB 的遗憾最优性

高斯过程最大上界置信（GP-UCB）是一个优化带噪声观测的黑盒函数的最受欢迎的方法之一，本文首次肯定地回答了在贝叶斯优化文献中的一个重要开放问题，即 GP-UCB 的遗憾是否是最优的，并提出了在目标函数具有某种平滑性质时 GP-UCB 的简单和累积遗憾的新上界，与具有相同平滑性质的优化函数的已知最小 - 最大下界匹配。

Dec, 2023