Jun, 2024

多阶段语言模型程序的指示和演示优化

TL;DR为了最大化下游度量而没有模块级别的标签或梯度,我们研究了语言模型程序的提示优化,即如何更新这些提示。我们通过优化自由形式的指令和少样本演示来解决这个问题,并引入了几种策略来制定任务相关的指令和在模块之间导航学分分配。使用这些策略,我们开发了一个名为 MIPRO 的新型优化器,在使用最先进的开源模型(Llama-3-8B)的六个不同的语言模型程序中,准确率高达 12.9% 优于基线。我们将在此 URL 发布我们的新优化器和基准测试。