Jul, 2024

问题分析提示提高推理任务中的LLM性能

TL;DR尽管LLMs在许多领域具有潜力,但在推理任务上仍不如人类表现出色。本研究探讨了一个问题:让LLM分析问题是否能提高其性能?我们提出了一种新颖的提示策略,称为问题分析提示(QAP),模型在解决问题之前被提示用$n$个词解释问题。值$n$影响模型生成的回答长度。在算术数据集GSM8K、AQuA、SAT和常识数据集StrategyQA上评估了QAP在GPT 3.5 Turbo和GPT 4 Turbo上的表现。QAP与其他领先的提示方法,包括思维链提示(CoT)、计划与解决提示(PS+)和深呼吸提示(TADB)进行了比较。在AQuA和SAT数据集上,QAP在GPT 3.5和GPT 4上的表现超过了所有的领先提示方法。在75%的测试中,QAP始终排名前2位。QAP表现的一个关键因素是回答长度,详细的回答对回答更难的问题有益,但可能对简单问题产生负面影响。