EMNLPOct, 2020

如何再次提问:使用连续空间中可控的重写进行问题数据增强

TL;DR本文提出一种新型的数据增强方法 CRQDA,利用 Transformer 自编码器和预训练的 MRC 模型生成与上下文相关、高质量和多样化的问题数据样本,通过在 SQuAD 2.0、SQuAD 1.1 问题生成和 QNLI 任务上的实验证明了其有效性。