Jan, 2022

使用线性转移模型进行元学习 MDPs

TL;DR研究了使用线性转移模型于 MDP 中的元学习,并提出了 BUC-MatrixRL 算法以显著提高高偏差低方差任务分布的转移后悔问题。