BriefGPT.xyz
Ask
alpha
关键词
model-free rl algorithms
搜索结果 - 2
ACE:具有因果感知熵调整的离策略演员 - 评论家算法
我们提出了 ACE 算法:基于因果关系的策略梯度法,通过引入因果关系熵项和梯度休眠现象引导重置机制,取得了在连续控制任务上显著的性能优势。
PDF
4 months ago
通过深度强化学习实现现实世界流体引导刚体控制
近期增加在强化学习实际应用方面的研究,依赖于能够在规模上准确模拟系统。然而,液体动力学系统等领域展示了复杂的动态现象,难以以高积分速率进行模拟,限制了现代深度强化学习算法在昂贵或安全关键硬件上的直接应用。在本研究中,我们引入了 “Box o
→
PDF
5 months ago
Prev
Next