ICLRMay, 2020

面向干预中心因果推理的学习代理

TL;DR使用元学习方法进行因果推断,通过深强化学习和元学习技术,可以在具有潜在因果结构的高维环境中,实现以干预为中心的因果推断。