ICLRMar, 2022

多智能体环境的动态噪声可提升泛化能力:基于智能体模型的强化学习方法

TL;DR本文研究了基于智能体模型的强化学习环境的好处。通过对比微分方程和智能体模型基础的流行病 SIR 环境的控制,数值模拟结果表明使用智能体模型的 SIR 模型固有噪声不仅可以提高平均奖励,还能让 RL 智能体在更广范围的流行病参数范围内进行泛化。