May, 2023

多智能体强化学习中的信息设计

TL;DR这项研究探索了多个强化学习代理中的信息设计问题,提出了Markov信号博弈的概念,根据信号梯度和扩展服从约束开发算法,有效地解决了非稳定性和信息被忽略的挑战,并在各种混合动机任务中提供了更深入的计算经济学见解。