BriefGPT.xyz
大模型
Ask
alpha
关键词
sequential planning
搜索结果 - 3
DPN: 分离划分和导航的神经求解器:最大最小车辆路径问题
通过提出了一个新颖的注意力机制启发式学习的编码器,以及一种有效的分解 - 分区 - 导航(Decoupling-Partition-Navigation)方法,本论文显著超越了现有的学习方法在单车库和多车库的最小 - 最大车辆路径规划问题中
→
PDF
a month ago
大型部分可观察环境中的顺序计划引导 LLMs
通过结合状态空间搜索和基于自然语言模型的查询,我们提出了一种混合代理方法 neoplanner,以最大化状态值的上界来平衡探索和开发,并通过查询自然语言模型以生成行动计划,进一步提高了大规模状态空间和行动空间的顺序规划的性能。
PDF
7 months ago
面向目标导向规划的分治蒙特卡罗树搜索
提出了一种名为 DC-MCTS 的计划算法,用于解决目标导向的强化学习问题,该算法通过给出中间子目标来逐步划分初始任务,并独立递归地解决更简单的任务,从而实现改进策略, 使规划顺序具有灵活性,得到了在格子世界和各种连续控制环境中的强大表现。
PDF
4 years ago
Prev
Next