Jul, 2020

局部分解动态的反事实数据增强

TL;DR本文介绍了一种利用局部因果模型(local causal models,LCMs)、逆因数据增强(Counterfactual Data Augmentation,CoDA)等方法来提高强化学习(reinforcement learning,RL)算法采样效率的方法。实验表明,在其所擅长的分解式任务中,该方法能显著提高算法的表现。