Apr, 2023

基于自监督任务表示学习的元强化学习

TL;DR本文提出了 MoSS 算法,它是基于上下文自监督任务表示学习的元强化学习算法,能够在非参数任务分布、非静态任务和分布任务等方面实现先进的数据效率和适应能力。