BriefGPT.xyz
Ask
alpha
关键词
multi-task rl
搜索结果 - 3
辅助任务蒸馏的增强学习
通过辅助任务蒸馏,我们提出了一种增强学习(RL)方法,使其能够通过从辅助 RL 任务中提取行为来解决长期规划的机器人控制问题。AuxDistill 通过并行进行辅助任务的多任务 RL,并通过加权蒸馏损失将这些辅助任务中的行为转移到主任务上,
→
PDF
12 days ago
ICLR
元元强化学习中的回顾、预测重标记
利用 Hindsight Foresight Relabeling 方法,将多任务强化学习中的 relabeling 概念扩展到元强化学习领域中,从而提高样本效率和渐近性能。
PDF
3 years ago
通过元学习子目标发现选项
使用元梯度法发现多任务强化学习环境中有用的选项的新方法,该方法使用一个管理器将发现的任务选项和基本操作结合在一起,并通过神经网络优化子目标的奖励和终止函数,实验证明该方法可以在学习过程中快速发现有意义和多样化的时间扩展选项,并且帮助初学者的
→
PDF
3 years ago
Prev
Next