BriefGPT.xyz
Ask
alpha
关键词
twin delayed deep deterministic policy gradients
搜索结果 - 2
基于混沌的深度增强学习与 TD3 算法
混沌增强学习(Chaos-based reinforcement learning,CBRL)是一种通过内部混沌动力学驱动探索的方法,本研究将最新的深度强化学习算法之一,即双延迟深度确定性策略梯度算法(Twin Delayed Deep D
→
PDF
2 months ago
基于强化学习的空战机动生成
本研究提出了一种利用深度强化学习技术(TD3)和经验回放(HER)来优化具有 Dubin 车辆动力学特性的无人机在二维空间中达到目标路径的方法,并在两种不同环境下进行了模拟实验,可用于 UAV 自主机动决策等领域。
PDF
2 years ago
Prev
Next