BriefGPT.xyz
Ask
alpha
关键词
diffusion-based trajectory stitching
搜索结果 - 1
DiffStitch:基于扩散的轨迹拼接技术提升离线强化学习
离线强化学习中,学到的策略性能高度依赖于离线数据集的质量。然而,在许多情况下,离线数据集只包含非常有限的最优轨迹,这对离线强化学习算法提出了挑战,因为智能体必须能够转移到高奖励区域。为了解决这个问题,我们引入了一种基于扩散的轨迹拼接(Dif
→
PDF
5 months ago
Prev
Next