Jan, 2024

大型语言模型中简明的思维链对问题解决的益处

TL;DR通过比较标准 CoT 和 CCoT 提示,我们介绍了简洁的思路链 (CCot) 提示,并评估了它对回答长度和正确答案准确性的影响。我们使用 GPT-3.5 和 GPT-4 在多项选择问答 (MCQA) 基准上进行了评估。CCoT 使得 GPT-3.5 和 GPT-4 的回答平均长度减少了 48.70%,对问题解决性能影响微乎其微。然而,在数学问题上,使用 CCoT 的 GPT-3.5 表现出了 27.69% 的性能惩罚。总体而言,CCoT 将每个标记的成本平均降低了 22.67%。这些结果对于使用 LLM 解决带有 CoT 提示工程技术的现实世界问题的 AI 系统工程师具有实际意义。此外,这些结果为研究 LLM 中逐步推理的新兴行为的 AI 研究人员提供了更普遍的见解。