BriefGPT.xyz
Ask
alpha
关键词
model-based method
搜索结果 - 3
透视强化学习的庞特里亚金方法
传统上,强化学习集中于学习状态相关策略以解决闭环最优控制问题;本文提出了开环强化学习范式,通过学习固定行动序列,引入了三种新算法:一种鲁棒的基于模型的方法和两种高效的无模型方法。基于开环最优控制理论中的庞特里亚金原理,而非动态规划中的贝尔曼
→
PDF
a month ago
通过 DreamerV3 技巧提高 Proximal Policy Optimization 的奖励尺度鲁棒性
基于模型方法 DreamerV3 的实验研究,揭示了 DreamerV3 的技巧在强化学习算法 PPO 中不适用的情况,同时还对技巧的实现方式及其对性能的影响进行了深入分析。
PDF
8 months ago
针对复杂观测的对比型变分强化学习
通过强化学习中的对比变分方法来解决视觉观测中的复杂性问题,在 Mujoco 任务和机器人推箱子任务中达到了与现有方法相当的状态,并在自然 Mujoco 任务中显著优于它们。
PDF
4 years ago
Prev
Next