Apr, 2024

只有LLMs可以进行推理吗?:小型语言模型在任务规划中的潜力

TL;DR通过构建COmmand-STeps(COST)数据集,我们比较了GPT3.5和GPT4与finetuned GPT2在桌面和厨房环境中的任务规划表现,结果表明GPT2-medium在特定领域的任务规划上与GPT3.5相当。