BriefGPT.xyz
Ask
alpha
关键词
online adaptation strategy
搜索结果 - 1
基于自监督任务表示学习的元强化学习
本文提出了 MoSS 算法,它是基于上下文自监督任务表示学习的元强化学习算法,能够在非参数任务分布、非静态任务和分布任务等方面实现先进的数据效率和适应能力。
PDF
a year ago
Prev
Next