Jun, 2021

利用观测和干预数据的因果强化学习

TL;DR本文探讨了利用 Causal Inference 理论和 Latent-based causal transition model 在 offline data 的基础上,使用 observational data 可以有效地提高 model-based RL agents 的 generalization guarantees 问题。