Apr, 2023

WizardLM:赋能大型语言模型遵循复杂指令

TL;DR本文介绍了一种使用大型语言模型(LLM)替代人类创建指令数据的方法,通过使用我们提出的 Evol-Instruct,从一个初始指令集开始,逐步将其重写为更复杂的指令,然后将生成的所有指令数据混合起来,以调整 LLaMA 模型,获得我们所称的 WizardLM 模型。人类评估证明,Evol-Instruct 出产的指令优于人工创建的指令,尤其是在高复杂度方面,WizardLM 模型的输出被认为比 OpenAI ChatGPT 的输出更好。尽管 WizardLM 在某些方面仍落后于 ChatGPT,但我们的研究表明,用人工智能生成的指令进行微调是提升大型语言模型的一个有前途的方向。