Feb, 2024

多智能体强化学习学习和校准异质有界理性市场行为

TL;DR在代理基模型中,我们提出了一种用于在多代理强化学习框架下表示异构处理受限代理的新技术,通过共享策略学习以及代理技能水平的分布,实现了从严格效用最大化到有界理性行为的过渡,并通过使用策略梯度来学习行为,通过在多个实例中验证,我们证明了该模型在许多常见的代理设置下具有显著改进的预测能力。