Jun, 2024

GenQA:从少数提示生成数百万个指令

TL;DR研究如何从单个提示生成大型指导数据集,使用较少的人工监督,使 LLMs 能够撰写多样化的指令示例,从简单的完成任务到复杂的多轮对话,并在知识密集型任务和对话评估中超过了 WizardLM 和 Ultrachat,在扩展性和可伸缩性方面超过了公共指导微调数据集。