Jan, 2024

CORE: 基于强化学习的可扩展高效因果发现

TL;DR该研究提出了一种基于深度强化学习的 CORE 方法,用于因果发现和干预计划。CORE 能够从数据中顺序地重建因果图,并学习执行信息丰富的干预策略,其在结构估计准确性和样本效率方面优于现有方法,并且能够适应更大的图形结构。