May, 2023
或许只需要0.5%的数据:低训练数据指令调优的初步探索
Maybe Only 0.5% Data is Needed: A Preliminary Exploration of Low
Training Data Instruction Tuning
TL;DR本文介绍了一种名为Low Training Data Instruction Tuning (LTD Instruction Tuning)的方式,从减少数据使用、优化任务性能、优化指令调整类型和使用任务特定模型等方面,降低大型语言模型(LLMs)指令调整的数据使用,提高数据利用效率。实验结果表明,可以使用少于原始数据集的0.5%来训练任务特定的模型,并且相较于使用完整的任务相关数据训练的模型,性能可提升2%。