Feb, 2024

非对称信息随机博弈中的初阶信念猜想式在线学习

TL;DR针对现有离线方法的局限性,本文提出了一种推测的在线学习 (COL) 方案,用于处理复杂的社会技术系统中存在信息不对称的随机博弈,通过利用隐藏状态的初级信念和对手策略的主观预测来通过贝叶斯学习校准猜测,并证明了 COL 的猜测在松弛贝叶斯一致性下渐近一致。实证结果表明,COL 在非稳态攻击情况下优于最先进的强化学习方法。