Apr, 2022

多智能体 Actor-Critic 与时间动态对手模型

TL;DR本文提出了一种名为 Time Dynamical Opponent Model 的新型多智能体强化学习方法,提高了智能体在协助和竞争环境中的管用性。