简单贝叶斯算法的最佳臂识别

Feb, 2016

Simple Bayesian Algorithms for Best Arm Identification

Daniel Russo

TL;DR本文提出了三种简单直观的贝叶斯算法，旨在通过适应性地分配测量功夫，有效地识别有限选项或设计中的最佳选择，而这些简单算法能够以最佳方式实现这一目标。

Abstract

This paper considers the optimal adaptive allocation of measurement effort for identifying the best among a finite set of options or designs. An experimenter sequentially chooses designs to measure and observes n

adaptive allocation bayesian algorithms measurement effort quality optimality

发现论文，激发创造

最优二元法用于最佳手臂识别和流体分析

针对最佳臂识别问题，本文提出了一种基于阈值的最优排名算法，通过对强度的函数分配进行采样来识别最佳臂，分析表明该算法在极限情况下是最优的。

Mar, 2024

高效纯探索的双向算法设计

在具有有限备选方案的随机顺序自适应实验中，我们考虑了纯探索问题。利用双变量，我们表征了最优分配的必要和充分条件，并提出了一个信息导向的选择规则。我们证明了，在某些条件下，与信息导向的选择相结合的前二 Thompson 抽样在高斯最优臂标识中是（渐近）最优的。

Oct, 2023

在贝叶斯多臂老虎机优化中利用相关性和预算限制

本文介绍了一种基于贝叶斯方法的多臂赌博机最佳臂识别优化方法，其着重于建模与多臂之间的相关性，相比已有的方法在允许的函数评估数目较小时能够取得更优的效果，在自动机器学习工具箱等实际应用中表现良好。对多种方法进行对比分析，阐明了它们不同特征之间的相对优劣。

Mar, 2013

关于最佳臂识别的最优样本复杂度

研究最优臂辨识问题，发现新算法和上下限优化，并提出一个新的关于最优样本复杂度的猜想。

Nov, 2015

线性赌博机中的最优臂识别

本文研究了随机线性武装的固定置信度下的最佳武器识别问题，目标是在最小化采样预算的同时确定最佳武器。设计了一种简单的算法，其采样复杂度与已知的特定实例下界匹配，在几乎必然的情况下一致性和期望上。此算法依赖于跟踪最佳比例的武器采样规则，而且可以很少更新而不影响其理论保证。此外，与现有的最佳武器识别策略不同，我们的算法使用的停止规则不依赖于武器数量。实验结果表明，我们的算法明显优于现有算法。本文还对具有连续武器集的线性武装的最佳武器识别问题进行了首次分析。

Jun, 2020

关于固定预算下二臂赌博机最优臂识别的统一最优算法

固定预算下的随机双臂赌博机最佳臂识别问题中，不存在优于均匀采样算法的算法，该问题的解决方案是引入一类称为 “一致稳定算法” 的自然算法，并证明该类算法与均匀采样算法的性能相同。

Aug, 2023

贝叶斯反问题鲁棒 A - 最优实验设计

为贝叶斯反演问题设计最优实验设计方案的一个高效算法方法，使最优设计对反问题的要素的错误估计具有鲁棒性。具体而言，我们考虑一种针对不确定或错误估计参数的最坏情况方法，提出了一种优化这些目标的算法方法，进行了深入的数值实验，以验证和分析所提出的方法。

May, 2023

具有固定预算的局部最优最佳臂鉴别

通过实验设计和策略分析，本研究旨在在固定的实验轮数下，识别具有最高预期结果的最佳治疗方案，以及减少误判的概率和通过计算概率下界来设计最优策略。

Oct, 2023

多层次最优臂识别

在本文中，我们研究多信度最佳臂识别问题，通过提出一种以梯度为基础的方法，我们找到了具有渐近最优成本复杂度的解决方案，并针对每个臂还提出了最优保真度的概念。

Jun, 2024

在线自适应交通实验的批处理贝叶斯采样算法实用性评估

本文通过对自适应交通实验的多臂赌博算法、贝叶斯批次赌博算法和流量分配等进行研究，提出了四种新的贝叶斯采样算法（NB-TS，WB-TS，NB-TTTS 和 WB-TTTS）并进行了综合评估。评估结果显示，WB-TTTS 是一个有前途的选择，如果 A/B 测试的惩罚可承受（例如，信息损失），否则 NB-TS 仍然是对于试验具有惩罚考虑的一个强大选择。

May, 2023