神经内核赌博机中表示学习与探索的实证分析

ICLRNov, 2021

神经内核赌博机中表示学习与探索的实证分析

Empirical analysis of representation learning and exploration in neural kernel bandits

Michal Lisicki, Arash Afkanpour, Graham W. Taylor

TL;DR本文介绍了在非线性结构数据中使用 NK-GPs 进行 policy learning 的方法，并比较了 GP 和 Student's t-process（TP）两种方法的表现，提出了一个用于独立测量算法学习表现和探索能力的框架，并探讨了训练频率和模型分区等实际考虑因素。

Abstract

neural bandits have been shown to provide an efficient solution to practical sequential decision tasks that have nonlinear reward functions. The main contributor to that success is approximate bayesian inference,

neural bandits approximate bayesian inference neural kernels (nk)policy learning gaussian processes

发现论文，激发创造

核和神经赌博中的纯探索

本文研究了一种新的纯探索选择策略，通过自适应地将每个手臂的特征表示嵌入到低维空间中并仔细处理引起的模型错误，成果展示了该方法在核空间或神经表示中实现的有效维度。实验证明了该方法的有效性。

Jun, 2021

图神经网络赌博机

研究如何在具有图结构数据的情况下，使用置换不变量将图神经网络用于奖励函数的估计，并通过设计一个分阶段消去算法实现亚线性的后悔保证。

Jul, 2022

神经切向核下的贝叶斯深度集成

我们通过神经切向核（NTK）探索深度集合和高斯过程（GPs）之间的联系，引入对标准深度集合训练的简单修改，其中包括对每个群集成员的可计算、随机且不可训练的函数的添加，以在无限宽度下启用后验解释，用于回归和分类任务中，证明了我们的贝叶斯深度集成在无限宽度限制下进行更保守的预测，可在不同的寻常数据的情况下胜过标准的深度集成。

Jul, 2020

核化多臂赌博机

本文提出了两种基于高斯过程的算法 - 改进的 GP-UCB（IGP-UCB）和 GP-Thomson 采样（GP-TS），并给出了相应的遗憾边界，在连续的臂集上解决了随机赌徒问题。当期望奖励函数属于复制核希尔伯特空间（RKHS）时，边界成立。在实验评估和对合成和真实世界环境中现有算法的比较中，突出了所提出策略的优势。

Apr, 2017

神经网络学习的统一核心

该论文介绍了一种名为 Unified Neural Kernel (UNK) 的方法，用于描述神经网络的学习动态以及参数初始化。通过渐进学习步骤，UNK 核的行为呈现类似于 Neural Tangent Kernel (NTK)，而随着学习步骤接近无穷大，其收敛于 Neural Network Gaussian Process (NNGP)。此外，论文还对 UNK 核的均匀紧密性和学习收敛性进行了理论表征，并通过实验证明了该方法的有效性。

Mar, 2024

灵活的无限宽度图卷积网络及表示学习的重要性

神经网络的无限宽度极限通常被认为是具有高斯过程分布的，称为神经网络高斯过程，然而固定的 NNGP 核函数无法进行表示学习，为了了解图分类和节点分类任务中表示学习的必要性，我们开发了一个精确的工具，即图卷积深核机器，发现表示学习对于图分类和异质节点分类任务是必要的，但对于同质节点分类任务则不是。

Feb, 2024

深度神经网络中表示学习的理论提供了核方法的深度广义化

本文介绍了一种基于无限宽的贝叶斯表达学习界限的深层高斯过程方法以及基于这个界限的核方法的深度泛化技术。实验证实这种方法能够处理有限宽的高斯方法以及 NNs，这将有助于在大规模数据上应用这种方法。

Aug, 2021

误设的高斯过程贝叶斯优化

本文提出了两种基于高斯过程（GP）方法的算法：一种乐观的 EC-GP-UCB 算法，另一种是一种消除型算法 Phased GP Uncertainty Sampling。本文给出了算法的上界，其依赖于时间长度和核心参数，证明了我们的算法在不知道错误情况下实现了对 ε 的最优依赖性，并证明了 EC-GP-UCB 可以与后悔边界平衡策略相结合。

Nov, 2021

小数据学习的概率嵌入深度核方法

通过使用概率神经网络学习概率嵌入深核，我们可以解决高维数据的表示学习和数据效率之间的问题，实验结果表明，我们的方法在监督和半监督学习中均优于现有的高斯过程核方法，并且扩展到其他小数据范例，在 mini-Imagenet 和 CUB 数据集上胜过先前的方法。

Oct, 2019

连接 NTK 和 NNGP：核区域中神经网络学习动力学的统一理论框架

通过使用具有随机初始化的无限宽度深度网络集合的马尔可夫接近学习模型，结合数值评估来合并和统一神经切向核（NTK）和神经网络高斯过程（NNGP）理论，并提供对机器学习中深度神经网络学习过程的全面理解。

Sep, 2023