Nov, 2023

AutoPlanBench: 从 PDDL 自动生成 LLM 规划器的基准测试

TL;DRLLM 规划器在规划和推理方面的能力仍未被充分了解,本文提出了一种将 PDDL 规划基准自动转化为文本描述的新方法,并使用该方法创建了一组基准数据集,研究表明虽然最好的 LLM 规划器在许多规划任务上表现良好,但仍有一些任务超出了当前方法的能力范围。