Oct, 2024
QuACK:一种多用途队列算法用于合作 $k$-臂赌博机
QuACK: A Multipurpose Queuing Algorithm for Cooperative $k$-Armed
Bandits
TL;DR本研究解决了合作随机 $k$-臂赌博机问题,通过提供一种黑箱降维方法,使得任何单一代理的赌博机算法都能扩展到多代理环境。在温和的环境假设下,我们证明这种降维方法将单代理算法的后悔保证转移至多代理设置,且在子高斯环境中,该保证是紧密的。该方法的广泛适用性为多种多代理设置提供了有效的解决方案。