ACLMay, 2018

AdvEntuRe: 带知识引导实例的文本蕴涵对抗训练

TL;DR本文提出了两种互补的方法来解决在受限监督(5K-10K 训练样本)的情况下学习文本蕴涵模型的问题:一是采用知识引导的对抗样本生成器来通过仅采用少量规则模板将大型词汇资源纳入蕴涵模型中;二是提出了首个采用自然语言例句生成器进行训练的 GAN-style 方法,以使蕴涵模型 - 判别器 - 更加稳健。在两个蕴涵数据集上进行的实证表明,所提出的方法在 SciTail 上将准确度提高了 4.7% ,在 SNLI 的 1% 训练子样本上将准确率提高了 2.8%。值得注意的是,即使是一个手写规则 “否定”,也将 SNLI 中否定样例的准确度提高了 6.1%。