Jul, 2022

动态定价中n人马尔可夫博弈的近似纳什均衡学习

TL;DR本文研究了具有竞争性的马尔可夫游戏中的Nash均衡学习,使用了一种新的无模型方法找到近似Nash均衡,其中策略 - ε对应性和状态至ε-最小策略是用神经网络表示的。在动态价格领域,可以学习到近似的Nash均衡。