BriefGPT.xyz
大模型
Ask
alpha
关键词
td3
搜索结果 - 4
基于混沌的深度增强学习与 TD3 算法
混沌增强学习(Chaos-based reinforcement learning,CBRL)是一种通过内部混沌动力学驱动探索的方法,本研究将最新的深度强化学习算法之一,即双延迟深度确定性策略梯度算法(Twin Delayed Deep D
→
PDF
2 months ago
机器人控制的 DRL 过程中的部分可观测性
本文研究了 Deep Reinforcement Learning 在机器人控制任务中的应用,特别是在部分可观性条件下,比较了 TD3、SAC 和 PPO 算法的表现,并提出了改进部分可观性下 TD3 和 SAC 算法鲁棒性的多步版本算法。
PDF
2 years ago
基于记忆的深度强化学习在 POMDPs 中的应用
本文介绍了一种基于 LSTM-TD3 的方法,该方法引入了记忆组件以应对部分可观察 MDPs,相比其他 DRL 算法,在具有部分可观察 MDPs 的情况下,该方法具有显著的优势,包括处理丢失和噪声观察数据的能力。
PDF
3 years ago
AAAI
风险规避强化学习的均值方差策略迭代
本研究提出了一种基于平均方差策略迭代 (MVPI) 框架的风险规避控制方法,采用任意策略评估方法和风险中立控制方法,通过对一个新颖的扩展 MDP 直接进行处理,减少风险中立控制与风险规避控制之间的差距,并介绍了一种风险规避 TD3 方法作为
→
PDF
4 years ago
Prev
Next