Mar, 2023

RACCER:面向强化学习的可达到和确定的反事实解释

TL;DR本文提出 RACCER,这是第一个针对 RL 行为生成对抗性解释的 RL 特定方法,我们使用 RL 特定的对抗性属性,并使用启发式树搜索算法来查找最合适的对抗性解释,并进行了用户研究以证明对抗性解释可以帮助用户更好地理解 RL 代理的行为。