Apr, 2023

Stubborn: 一种用于评估具有相似激励的代理之间顽固性的环境

TL;DR本文主要介绍了一种基于多智能体强化学习 (MARL) 的环境 Stubborn,用于研究完全合作环境下代理之间的固执程度对社会动态的影响,并探究如何通过这种固执行为来提高环境中代理的智能行为选择。