Feb, 2021

多智能体强化学习中集中式与分散式评论员的对比

TL;DR本论文分析了中央化和去中央化的评分员方法,旨在提供评分员选择的更深层次理解并阐述算法设计者应考虑到评分员方法的优缺点。