IJCAIJul, 2018
基于预期后果的强化学习对比解释
Contrastive Explanations for Reinforcement Learning in terms of Expected Consequences
Jasper van der Waa, Jurriaan van Diggelen, Karel van den Bosch, Mark Neerincx
TL;DR本文提出了一种方法,使强化学习代理能够解释其行为,以期实现机器学习模型的透明化。通过将状态和行动转换为易于人类理解的描述,并使用一种可生成解释的格式,进行了计算,结果表明人类用户倾向于关注政策而非单个操作。