IJCAIJun, 2022

基于课程的自训练提高数据到文本生成的少样本学习效果

TL;DR本研究提出一种基于自学习的数据到文本生成方法,通过前置学习模型生成的伪标签数据,显式地捕捉数据和文本之间的复杂关系,以及一种称为基于课程设置的自学习 (CBST) 的新方法来缓解伪标签数据的质量问题,在少量标记的数据集下显著优于基于现有技术的元认知预训练和微调方法,本方法成为数据到文本生成领域中的最佳方法。