Dec, 2022

使用跨任务最近邻实现高效数据微调

TL;DR本文提出了一种基于多任务数据池的语言模型训练方法,通过对少量未标记的目标任务实例进行最近邻匹配和筛选,以此选择有助于目标任务训练的数据,此方法在数据利用率、性能优化和基于少量训练样本下的效果提升方面表现良好。