Oct, 2023

基于混合模型的继承特征强化学习在任务间的不确定性迁移

TL;DR使用混合模型驱动的继任特征算法和不确定性感知探索的方法,能够在具有不同转换动力学或 / 和奖励函数的任务之间实现高效的知识传输,并且在决策时间上所需的计算量较少。通过与最近的继任特征算法和模型驱动方法进行对比,结果表明我们的算法能够在不同的转换动力学中泛化知识,使用明显更少的样本学习下游任务,并且优于现有方法。