Sep, 2023

大型语言模型作为优化器

TL;DR在此工作中,我们提出了一种名为 OPRO 的优化方法,利用大型语言模型作为优化器,通过自然语言描述优化任务。我们首先展示了 OPRO 在线性回归和旅行商问题上的应用,然后转向优化提示,目标是找到最大化任务准确性的指令。我们通过多种大型语言模型的实验证明,OPRO 通过优化提示的方式胜过人工设计的提示,在 GSM8K 上提高了最多 8%,在 Big-Bench Hard 任务上提高了最多 50%。