Sep, 2020

一种简单而又难以击败的数据增强方法,用于自然语言理解和生成

TL;DR本论文提出了一种简单且有效的数据增广策略 ——“cutoff”,并采用 Jensen-Shannon Divergence 一致性损失将这些增广样本融入到训练目标中,以有效提升人工智能在自然语言理解和生成,机器翻译等领域的表现。cutoff 方法与竞争对手相比表现相当甚至更好,并在 IWSLT2014 German-English 数据集上取得了最优性能。