May, 2019

因果透镜下的可解释强化学习

TL;DR本文使用因果关系模型来推导强化学习器的行为的因果解释,并通过对一项实验的研究结果表明,基于因果模型的解释在任务预测、解释满意度和信任方面表现更好。