Aug, 2024

固定预算贝叶斯最佳臂识别中的UCB探索

TL;DR本研究解决了固定预算情况下最佳臂识别中的理论不足。提出了一种基于UCB的探索算法,通过学习先验信息,显著提升了算法的表现。实验结果表明,该方法在固定预算贝叶斯最佳臂识别问题上优于现有的最先进算法。