Nov, 2020

通过预期结果解释代理行为:你认为会发生什么?

TL;DR论文通过意图结果的概念,提出了一种新的加强学习解释形式,介绍了针对几种Q函数逼近的局部解释提取方法,并在多个环境和算法上进行了演示。