BriefGPT.xyz
Ask
alpha
关键词
hybrid rl
搜索结果 - 4
混合逆强化学习
我们提出使用混合增强学习的方法来减少反向强化学习中不必要的探索,通过专家数据在训练过程中引导学习者,从而缩小小型逆强化学习问题的交互过程,取得了较好的策略表现。
PDF
5 months ago
ICLR
利用密度比例进行在线强化学习
该论文介绍了离线强化学习和在线强化学习的统一理论以及密度比建模在在线强化学习中的存在,并提出了 GLOW 算法和 HyGLOW 算法作为在线探索的方法。
PDF
6 months ago
离线数据增强的有保证的在线策略梯度
融合强化学习是指强化学习智能体能够同时访问离线数据和与真实环境进行交互的在线数据。本文提出了一种新的融合强化学习算法,它将基于策略的演员 - 评论家方法与离线数据相结合。理论上,我们的方法在离线强化学习特定假设成立时可以获得最佳结果,同时无
→
PDF
8 months ago
机器人移动操作的可达性行为先验学习
本文提出了一种混合强化学习算法和机器人可达性先验方法,加速了移动操作系统的学习速度,提高了机器人应对现实环境中的任务的表现。
PDF
2 years ago
Prev
Next