BriefGPT.xyz
大模型
Ask
alpha
关键词
heuristic guidance
搜索结果 - 2
大型语言模型的规划能力 - 一项关键调查
本文旨在研究 LLLms 在常识规划任务中的规划能力,通过在国际计划竞赛中生成一系列实例,并评估 LLMs 在自主规划和启发式两种不同模式下的表现,发现 LLMs 在自主规划方面的表现非常有限,但在启发式模式下,LLMs 生成的计划可以改善
→
PDF
a year ago
关于大型语言模型的规划能力(一项带有提议基准的关键调查)
研究了通用 Web 语料库上训练的语言模型的计划能力,开发了基于国际计划竞赛领域的基准套件,在自治、启发式和人机协作模式下对 LLM 进行了评估,发现自主生成可执行计划的能力非常有限,只有约 3% 的成功率。
PDF
a year ago
Prev
Next