BriefGPT.xyz
Ask
alpha
关键词
context-based rl
搜索结果 - 1
论离线元强化学习任务表示学习中的上下文分布转移
本文介绍了离线元强化学习(OMRL)的上下文基础,特别是针对 OMRL 的任务表示学习问题。我们提出了一种硬采样的策略来学习一个强大的任务上下文编码器,实验结果表明,与基线方法相比,在多个不同的连续控制任务中,使用我们的技术可以得到更强壮的
→
PDF
a year ago
Prev
Next