Mar, 2024

LinearAPT:适应性算法用于有固定预算的线性赌奇臂问题

TL;DR该研究深入研究了阈值线性赌博机(TLB)问题,这是随机多臂赌博(MAB)问题中的一个细分领域,侧重于在资源约束下最大化对线性定义的阈值的决策准确性。我们提出了 LinearAPT 这个新算法,它适用于 TLB 的固定预算情景,为优化序贯决策提供了高效的解决方案。该算法不仅对估计损失提供了理论上界,还展示了在合成和实际数据集上的强大性能。我们的贡献突出了 LinearAPT 的适应性、简洁性和计算效率,使其成为解决复杂序贯决策挑战的重要工具。