IJCAIMay, 2023

通过因果世界模型实现可解释的强化学习

TL;DR本文针对强化学习中行为的长期影响,提出了一种基于因果世界模型的可解释强化学习框架。该模型能够捕捉行为的影响,通过因果链解释行为的长期效应,从而提高模型的可解释性,同时保持了准确性,使其适用于基于模型的学习。实验结果表明,因果模型可以作为解释性和学习之间的桥梁。