ICLRJun, 2019

强化学习因果发现

TL;DR使用强化学习和编码器 - 解码器模型进行因果发现,生成图中的邻接矩阵以计算奖励,结合预定义分数函数和惩罚项强制保持无环性,提高图搜索能力和灵活性。