BriefGPT.xyz
大模型
Ask
alpha
关键词
latent-space model
搜索结果 - 1
ICLR
简化基于模型的强化学习:使用单一目标学习表示、潜空间模型和策略
本研究提出了一种单一目标的方法,该方法同时优化隐空间模型和策略以实现高回报并保持自一致性,从而在提高样本效率的同时实现更好的强化学习效果。
PDF
2 years ago
Prev
Next