Aug, 2024

FANNO:利用开源大型语言模型增强高质量指令数据

TL;DR该研究解决了注释指令数据集的高昂成本和劳动力密集的问题。FANNO是一种全自动的开源框架,通过文档预筛选、指令生成和响应生成的结构化过程,高效地生成多样化和高质量的数据集。实验结果表明,FANNO生成的数据在多样性和复杂性方面可与人工注释的数据集媲美,具有重要的潜在影响。