Mar, 2022

多智能体强化学习中的记忆和遗忘经验回放

TL;DR将 Remember and Forget for Experience Replay(ReF-ER)算法扩展到了多智能体强化学习(MARL)领域,并在 Stanford Intelligent Systems Laboratory(SISL)环境中的对比实验中证明,采用单级前馈神经网络模型实现 ReF-ER MARL 算法,其性能表现优于现有复杂神经网络架构的算法。