BriefGPT.xyz
大模型
Ask
alpha
关键词
mujoco control tasks
搜索结果 - 2
基于相似度的知识转移用于跨领域强化学习
通过开发半监督对齐损失来匹配不同空间的一组编码器 - 解码器,本研究研究了如何衡量跨领域强化学习任务之间的相似性,以选择能够提高学习代理性能的知识源。实验结果表明,在各种 Mujoco 控制任务中,我们的方法能够有效地选择和传递知识,而无需
→
PDF
7 months ago
提高基于图像的模型自由强化学习的样本效率
通过引入辅助损失以及消除后效性的影响,提出了一种简单且有效的方法,可以在 MuJoCo 控制任务上匹配最新的无模型和有模型算法,同时在观测噪声下表现出鲁棒性,并且过来了以往使用变分自动编码器所面临的发散问题。
PDF
5 years ago
Prev
Next