Feb, 2024
从零开始的合成数据:通用指令调整用于语言模型
Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models
Haoran Li, Qingxiu Dong, Zhengyang Tang, Chaojun Wang, Xingxing Zhang...
TL;DR借助预先策划的人类知识和能力分类体系, GLAN 是一种适用于大型语言模型(LLM)的通用且可扩展的指令调整方法,它能纵向横向生成大规模的合成指令数据,覆盖人类知识和技能的完整领域。