BriefGPT.xyz
Ask
alpha
关键词
probabilistic model predictive control
搜索结果 - 1
基于概率模型预测控制的高效数据强化学习
本文提出了基于概率模型预测控制(MPC)的基于模型的 RL 框架,以减少与环境的相互作用次数的方法。该方法使用高斯过程学习概率转换模型来减少模型误差的影响,同时使用 MPC 找到最小化预期长期成本的控制序列,以达到在受限环境下使用 RL 的
→
PDF
7 years ago
Prev
Next