Mar, 2022

AKF-SR: 自适应卡尔曼滤波后继表征

TL;DR该研究提出了基于自适应卡尔曼滤波的继承表达法,其中包括卡尔曼滤波和时变差分法,实现 SR 学习过程的不确定性估计,并提出了一种基于估计 SR 不确定性的主动学习方法,以提高智能体在与环境交互中的总体性能。