Mar, 2022

ReCCoVER:检测可解释强化学习中的因果混淆

TL;DR本文提出了 ReCCoVER 算法,该算法可以在出现因果混淆的情况下增强深度强化学习智能体的透明度和可靠性,并为开发人员提供基于实际状态空间的特征选择建议。