Jul, 2023

在线学习和使用 ERM 预测子解决无限博弈

TL;DR本文提出了一种基于 ERM 孤注一掷算法的在线二元分类方法,证明了它在真实问题上的收益有限,且在迷惑问题上的收益不断增长。同时,本文还探讨了 ERM 算法在非参数博弈中的应用,提出了一种不依赖于最优反应的学习算法,并将其应用到两人和多人博弈中,证明了算法的有效性和可靠性。