May, 2024

通过高斯过程在黑盒游戏中进行纳什均衡的无悔学习

TL;DR这篇论文研究了学习在黑盒游戏中的挑战,其中底层效用函数对任何代理都是未知的。通过实证查询的形式,我们提供了一种利用高斯过程来识别这类游戏中平衡点的无悔学习算法。我们的方法不仅确保了理论上的收敛速率,还通过实验验证在各种游戏中的有效性。