Jun, 2021
利用观测和干预数据的因果强化学习
Causal Reinforcement Learning using Observational and Interventional Data
Maxime Gasse, Damien Grasset, Guillaume Gaudron, Pierre-Yves Oudeyer
TL;DR本文探讨了利用 Causal Inference 理论和 Latent-based causal transition model 在 offline data 的基础上,使用 observational data 可以有效地提高 model-based RL agents 的 generalization guarantees 问题。