Sep, 2024

面临模糊原则的乐观主义在多臂赌博中的应用

TL;DR本研究解决了现有多臂赌博算法在处理模糊性时的不足,提出了一种新的乐观算法,兼具计算效率与统一的悔期分析。最重要的发现是,该算法能够高效生成最优策略,显著加速了计算过程,且能统一现有算法,展现了在不确定性下的潜力。