BriefGPT.xyz
Ask
alpha
关键词
local policy
搜索结果 - 2
优化基于启发式搜索的学习局部 MAPF 策略
多智能体路径规划是解决一组智能体到达目标位置的无碰撞路径问题。先进的经典多智能体路径规划求解器通常采用启发式搜索方法以找到数百个智能体的解决方案,但通常是集中式的,而在短时间内可能难以扩展。机器学习方法学习每个智能体的策略非常吸引人,因为它
→
PDF
3 months ago
神经时间反演广义瑞克蒂方程
本文介绍了一种新颖的基于神经网络的最优控制方法,该方法旨在通过在时间上前进来实现最优控制。神经网络不仅用于实施状态动态,还用于估计共轭变量。通过引入一种新的局部策略,即时间反转的广义 Riccati 方程,来确定后一网络的参数。通过讨论一系
→
PDF
7 months ago
Prev
Next