Jan, 2020

无模型可解释强化学习的远距离解释

TL;DR本论文介绍和评估了一种远程解释模型,该模型可为模型无关的强化学习代理生成为 “为什么” 和 “为什么不” 问题的解释,通过决策树和因果模型可分析对立假设和机会链。实验表明,该模型在不同强化学习算法的 6 个基准测试中产生了改进的结果。