Jan, 2024

BET: 通过错误决策解释深度强化学习

TL;DR提出了一种名为Backbone Extract Tree(BET)的全新的自解释结构,可以更好地解释代理的行为,识别易出错的状态,并且在各种流行的强化学习环境下显示出其对现有自解释模型的优越性能。