Feb, 2024

具有资源约束的最佳臂识别

TL;DR在资源约束下,通过资源消耗来识别最佳模式的 Best Arm Identification 问题中,我们设计并分析了基于资源分配的逐步减半算法 (SH-RR),它在成功识别最佳模式的概率方面实现了接近最优的非渐进收敛速度;有趣的是,我们在确定性和随机资源消耗的情况下发现了收敛速度上的差异。