Oct, 2023

大型语言模型的自主树搜索能力

TL;DR大型语言模型在高级提示技术方面具有出色的推理能力,但在需要探索、战略前瞻和序贯决策的任务上存在不足。最近的研究通过利用外部程序定义搜索逻辑,使 LLMs 能够执行被动树搜索以解决更具挑战性的推理任务。我们提出了一种名为 LLM 的自主树搜索能力的新概念,它可以自动生成包含正确答案的搜索轨迹的响应。在 4 个益智游戏上的实验表明,我们的方法可以取得巨大的改进。与先前的方法相比,ATS-BFS 方法在准确性上提高了 33%,而 GPT API 成本降低了 65.6% 或 47.7%。此外,我们使用 ATS 提示方法收集数据并对 LLaMA 进行微调,在 LLaMA2-7B 和 LLaMA2-13B 上相对于 CoT-tuned LLaMAs 提高了 40.6% 和 38.5%。