Oct, 2023

Ensemble-Instruct: 使用异构的语言模型生成指导调整数据

TL;DR使用上下文学习(ICL)来进行数据生成,结合自我指导和山羊驼等技术可以只通过少量人工监督即可训练出强大的对话代理。本论文研究探索了将这些技术应用于更小(大约10B-40B参数)且具有宽松许可的语言模型,并提出了新的ICL方法来提高指令学习数据的质量和改进指令调优的语言模型性能。