关键词value iteration networks
搜索结果 - 5
- ICML高速价值迭代网络
使用可微分规划模块和嵌入式高速值迭代的方法,有效地解决了长期规划问题并在数百个规划步骤中超越了传统的值迭代网络和一些很深的神经网络。
- 带门控摘要模块的价值迭代网络
本文提出了一种名为 GS-VIN 的价值迭代网络,该网络采用自适应迭代策略来降低迭代次数,并引入了门控汇总模块来总结整个迭代过程,研究表明在 2D 网格世界路径规划问题和 Atari Mr. Pac-man 环境中,GS-VIN 在单步准确 - XLVIN:执行的潜在价值迭代网络
我们提出了一种叫做 XLVINs 的新方法,它通过结合对比自监督学习、图表示学习和神经算法推理等新方法,成功地在一般环境中部署了 VIN 风格的模型,克服了目前主要存在的局限性,同时匹配了在固定和已知的离散 MDP 情况下的 VIN 模型的 - ICML门控路径规划网络
将值迭代网络(VIN)重新构建为递归卷积网络,提出了门控路径规划网络(Gated Path Planning Network)并提出标准门控循环更新方程可以缓解优化问题,取得了比 VIN 更好的性能,可用于多种场景下的导航规划。
- 基于价值迭代网络的非完整智能体的协同运动规划
本研究将 Value Iteration Networks 扩展为解决协作规划任务,通过多个 VINs 相互连接并通过迭代梯度下降生成协作策略,验证结果表明,所得网络能够解决需要协作的非完整性运动规划问题。