Feb, 2024

释放大语言模型作为启发优化器的潜力:一种与基于梯度的模型优化器的类比分析

TL;DR自动提示优化是改进大型语言模型性能的重要方法。本文提出了一种新颖的视角,通过与基于梯度的模型优化器进行类比,设计了改进的LLM-based提示优化器的策略。实验结果表明GPO具有有效性和高效性,并分别相对基准方法在Big-Bench Hard和MMLU上带来了多达56.8%和55.3%的额外改进。