BriefGPT.xyz
Ask
alpha
关键词
planning methods
搜索结果 - 5
语言代理的元任务规划
此研究论文介绍了 Meta-Task Planning (MTP),一种用于协作式基于大型语言模型的多智能体系统的零样本方法,通过将复杂任务分解成次级任务或元任务来简化任务规划,进而将每个元任务映射为可执行动作。该方法在 TravelPla
→
PDF
a month ago
LLM 规划中何时使用树搜索?取决于鉴别器
本文研究了大型语言模型在语言代理框架下如何通过生成器、鉴别器和规划方法解决多步骤问题。我们调查了两种先进的规划方法,即迭代修正和树搜索的实际效用。通过对文本到 SQL 解析和数学推理两个任务的实验发现:(1)先进的规划方法要求鉴别器的准确率
→
PDF
5 months ago
自动驾驶的运动规划:现状和展望
该论文旨在综述智能车辆的规划方法,介绍了管道规划和端到端规划方法,并探讨了挑选算法和训练方法的不同考虑因素以及当前的挑战和未来方向。
PDF
a year ago
基于目标条件策略的规划
本文提出了一种结合规划方法和强化学习的方法,利用强化学习学习目标驱动策略,从而让规划方法更好地实现任务;同时利用一个潜在变量模型来简洁地表示规划中的有效状态,从而将行为抽象和状态抽象分离。实验结果表明本文提出的方法能够在机器人导航和操作任务
→
PDF
5 years ago
ICML
使用变化状态表的高效基于模型的深度强化学习
使用 VaST 的优先级扫描规划方法,提高强化学习智能体的样本效率。在 3D 导航等任务中,VaST 能够快速学习并有效地适应奖励或过渡概率的突然变化。
PDF
6 years ago
Prev
Next