Oct, 2022

使用未标记数据学习指令,以实现零样本跨任务泛化

TL;DR本文提出了Unlabeled Data Augmented Instruction Tuning (UDIT)算法,通过使用未标注的文本数据构建伪标注数据,以更好地利用指令来提高指令微调的性能,实验结果表明UDIT在不同场景下都具有较好的效果。