Jul, 2020
局部分解动态的反事实数据增强
Counterfactual Data Augmentation using Locally Factored Dynamics
Silviu Pitis, Elliot Creager, Animesh Garg
TL;DR本文介绍了一种利用局部因果模型(local causal models,LCMs)、逆因数据增强(Counterfactual Data Augmentation,CoDA)等方法来提高强化学习(reinforcement learning,RL)算法采样效率的方法。实验表明,在其所擅长的分解式任务中,该方法能显著提高算法的表现。