Oct, 2022

自适应系统在线强化学习决策解释

TL;DR提出了一种结合两种可解释强化学习技术的方法,名为 XRL-DINE,可用于解释具有设计时间不确定性的自适应系统中的 Deep RL 决策。