Oct, 2022

将政策摘要与奖励分解相结合,解释强化学习代理

TL;DR本研究探讨将局部和全局解释方法相结合,通过激励分解和 HIGHLIGHTS 两种解释方式,帮助用户理解强化学习算法在决策制定时行为的策略,并通过两个用户研究证明两种方法的显著优势。