Nov, 2022

GENIUS: 使用极限与选择性Masking进行基于草图的语言模型预训练,用于文本生成和增强

TL;DRGENIUS是一种基于条件文本生成模型,利用素描作为输入,通过构建从素描目标到新样本的映射,生成高质量文本,并归纳提出了一个名为GeniusAug的数据增强方法,可以通过对原始数据集转换而来的目标感知的素描进行样本生成,进而用于自然语言处理各种任务,实验结果表明GeniusAug可以显著改善模型在数据分布范围内和外的性能