IJCAIMay, 2021

基于排序的强化学习因果探索

TL;DR本篇研究提出了一种新颖的基于强化学习 (RL) 的因果推断方法,通过将 RL 合并到基于排序的模式中,并通过一个编码器 - 解码器架构实现排序生成过程,并最终使用 RL 优化所提出的模型来处理生成的排序,以获得最终的因果图。在合成和真实数据集上的实验结果表明,所提出的方法比现有的 RL-based 方法具有更好的性能。