Apr, 2024

高回放率赋予样本高效的多智能体强化学习

TL;DR增加重播比例(或更新至数据比例)可以显著提高多智能体强化学习算法的样本效率。