Jun, 2023

用于非平稳多智体强化学习的黑盒方法

TL;DR本文提出了一种 black-box 的方法来学习在非稳态多智能体系统中的均衡,可以适用于广泛的问题,如一般和游戏、潜在游戏和马尔科夫游戏,并在测试次数和非稳态程度的度量下,取得了可接受的性能表现。