简单贝叶斯算法的最佳臂识别
在具有有限备选方案的随机顺序自适应实验中,我们考虑了纯探索问题。利用双变量,我们表征了最优分配的必要和充分条件,并提出了一个信息导向的选择规则。我们证明了,在某些条件下,与信息导向的选择相结合的前二 Thompson 抽样在高斯最优臂标识中是(渐近)最优的。
Oct, 2023
本文介绍了一种基于贝叶斯方法的多臂赌博机最佳臂识别优化方法,其着重于建模与多臂之间的相关性,相比已有的方法在允许的函数评估数目较小时能够取得更优的效果,在自动机器学习工具箱等实际应用中表现良好。对多种方法进行对比分析,阐明了它们不同特征之间的相对优劣。
Mar, 2013
本文研究了随机线性武装的固定置信度下的最佳武器识别问题,目标是在最小化采样预算的同时确定最佳武器。设计了一种简单的算法,其采样复杂度与已知的特定实例下界匹配,在几乎必然的情况下一致性和期望上。此算法依赖于跟踪最佳比例的武器采样规则,而且可以很少更新而不影响其理论保证。此外,与现有的最佳武器识别策略不同,我们的算法使用的停止规则不依赖于武器数量。实验结果表明,我们的算法明显优于现有算法。本文还对具有连续武器集的线性武装的最佳武器识别问题进行了首次分析。
Jun, 2020
固定预算下的随机双臂赌博机最佳臂识别问题中,不存在优于均匀采样算法的算法,该问题的解决方案是引入一类称为 “一致稳定算法” 的自然算法,并证明该类算法与均匀采样算法的性能相同。
Aug, 2023
为贝叶斯反演问题设计最优实验设计方案的一个高效算法方法,使最优设计对反问题的要素的错误估计具有鲁棒性。具体而言,我们考虑一种针对不确定或错误估计参数的最坏情况方法,提出了一种优化这些目标的算法方法,进行了深入的数值实验,以验证和分析所提出的方法。
May, 2023
本文通过对自适应交通实验的多臂赌博算法、贝叶斯批次赌博算法和流量分配等进行研究,提出了四种新的贝叶斯采样算法(NB-TS,WB-TS,NB-TTTS 和 WB-TTTS)并进行了综合评估。评估结果显示,WB-TTTS 是一个有前途的选择,如果 A/B 测试的惩罚可承受(例如,信息损失),否则 NB-TS 仍然是对于试验具有惩罚考虑的一个强大选择。
May, 2023