Sep, 2022

通过模型转换的可解释强化学习

TL;DR通过使用形式化的马尔科夫决策过程抽象和转换,以自动产生解释的方式,解释强化学习智能体的新兴行为。