Apr, 2023

论离线元强化学习任务表示学习中的上下文分布转移

TL;DR本文介绍了离线元强化学习(OMRL)的上下文基础,特别是针对 OMRL 的任务表示学习问题。我们提出了一种硬采样的策略来学习一个强大的任务上下文编码器,实验结果表明,与基线方法相比,在多个不同的连续控制任务中,使用我们的技术可以得到更强壮的任务表示和更好的测试性能。