Apr, 2016

使用强化学习验证实证博弈理论分析:一项连续双边拍卖研究

TL;DR本文提出使用强化学习分析 EGTA 发现的 Nash 平衡策略的遗憾,并开发了强化学习工具库用于证明 EGTA 在连续双重拍卖市场研究中发现的均衡具有可接受的遗憾程度。