Jan, 2025

基于回合的多智能体强化学习模型检测

TL;DR本文针对当前验证回合制多智能体强化学习(TMARL)代理在随机多玩家游戏中的合规性存在的不足,提出了一种新方法。该方法通过将TMARL与模型检测技术紧密结合,克服了现有验证方法的局限性,并在不同环境中的实验结果显示其有效性和良好的可扩展性。