Jun, 2019

基于注意力增强代理的可解释强化学习

TL;DR本文提出了一种结合软性、自上而下的注意机制的强化学习模型,使用信息瓶颈迫使智能体只关注任务相关信息,从而生成容易解释的模型。在 ATARI 游戏上实现了与最先进模型竞争力相当的性能。