Feb, 2023

元世界条件神经过程

TL;DR提出了 Meta-World 条件神经过程(MW-CNP),是一种使用条件神经过程的条件世界模型生成器,使得代理可以从其自身 “幻想” 中采样,以尽可能减少测试时与目标环境的交互,并通过生成的 “幻觉” 让代理与任务适应,以显著减少与基线相比从目标环境中收集的样本数量。