BriefGPT.xyz
Ask
alpha
关键词
task representation learning
搜索结果 - 2
论离线元强化学习任务表示学习中的上下文分布转移
本文介绍了离线元强化学习(OMRL)的上下文基础,特别是针对 OMRL 的任务表示学习问题。我们提出了一种硬采样的策略来学习一个强大的任务上下文编码器,实验结果表明,与基线方法相比,在多个不同的连续控制任务中,使用我们的技术可以得到更强壮的
→
PDF
a year ago
ICML
通过对比学习实现离线元强化学习的稳健任务表示
在离线元强化学习的背景下,提出了一种对抗学习框架,用于学习对行为策略不敏感的任务表示,并通过对各种离线元强化学习基准测试的实验,展示了该方法相比之前的方法在行为策略的泛化能力方面的优越性。
PDF
2 years ago
Prev
Next