BriefGPT.xyz
Oct, 2020
GenAug:用于微调文本生成器的数据增强
GenAug: Data Augmentation for Finetuning Text Generators
HTML
PDF
Steven Y. Feng, Varun Gangal, Dongyeop Kang, Teruko Mitamura, Eduard Hovy
TL;DR
本研究探索了一种名为GenAug的文本生成数据增强方法,利用包括外部知识在内的各种增强方法在Yelp评论的子集上进行GPT-2微调,并研究了增强数量与生成文本质量之间的关系,实验表明插入字符级合成噪声和使用上位词进行关键词替换是有效的增强方法,生成质量在原始数据量的三倍左右达到峰值。
Abstract
In this paper, we investigate
data augmentation
for
text generation
, which we call GenAug.
text generation
and language modeling are impor
→