BriefGPT.xyz
Ask
alpha
关键词
dyna-mpc
搜索结果 - 1
ICML
无监督模型预训练:从像素到高效控制
本文提出了一种基于无监督 RL 策略的数据高效视觉控制的方法,通过使用 Dyna-MPC 等组件的预训练来实现更快的任务适应,并且在大规模实证研究的基础上建立了一种强化学习方法,可以使无监督设计策略的性能大大提高。
PDF
2 years ago
Prev
Next