Feb, 2021

通过熵正则化的深度强化学习近似求解均场博弈

TL;DR本文研究了离散时间有限 MFG 问题,通过使用熵正则化和 Boltzmann 策略使得固定点迭代收敛到近似固定点,同时提供了在高维场景下使用的近似 Nash 均衡算法以及结合虚拟博弈的深度强化学习方法。