AAAIFeb, 2022

强化学习的本地解释

TL;DR本文介绍了一种基于元态的深度强化学习策略理解方法,通过识别从自动学习的元状态中的重要状态,而非从行为相似性出发,来帮助领域用户理解深度强化学习策略,实验结果表明,这种方法可以帮助我们更好地理解深度强化学习策略。