BriefGPT.xyz
大模型
Ask
alpha
关键词
high-dimensional control problems
搜索结果 - 2
基于深度 Galerkin 反馈法的智能体动力学最优控制
通过采用基于漂移放松的采样方法,本文研究了 Deep Galerkin 方法所面临的采样问题,通过验证 Sznajd 和 Hegselmann-Krause 模型中的意见动态变化的多场控制问题,得出的策略在手动优化控制函数上实现了显著成本降
→
PDF
19 days ago
ICLR
针对行动相关分解基线的策略梯度方差缩减
本研究提出了一种无偏差的基于动作的基线方法,该方法可以减少深度增强学习中梯度估计的高方差问题,最终实现高维控制问题的策略梯度算法。此外,还证明了该方法的有效性并扩展到部分观察和多智能体任务。
PDF
6 years ago
Prev
Next