Jan, 2020

转移强化学习的通用继承特征

TL;DR本文提出了通用后继特征用于环境建模和知识迁移,实验结果表明,该方法可以加速多任务学习且在新任务中有效地迁移知识。