EMNLPOct, 2023

InstOptima: 多目标进化指令优化方法 —— 基于大型语言模型的指令操作

TL;DR我们提出了一种名为 InstOptima 的新方法,将指导生成作为一种进化多目标优化问题,并借助大型语言模型模拟指导操作符,通过引入一个目标引导机制来改进生成指导的质量,实验证明了改进的微调性能和生成一系列高质量指导的多样性。