BriefGPT.xyz
Ask
alpha
关键词
downstream rl
搜索结果 - 1
强化学习的离线多任务表示学习
我们研究了强化学习中的离线多任务表示学习,理论上研究了离线多任务低秩强化学习,并提出了一种名为 MORL 的用于离线多任务表示学习的新算法。此外,我们还研究了奖励缺失、离线和在线情景下的下游强化学习,在其中引入了一个与上游离线任务共享相同表
→
PDF
4 months ago
Prev
Next