Feb, 2020

使用合成数据训练问答模型

TL;DR通过利用大型语言模型,研究了模型大小、预训练模型的质量、合成数据的规模和算法选择等多个因素,缩小了人工和合成问题 - 答案对之间的差距。该研究通过模型生成的数据,在 SQuAD 数据集上实现了良好的准确率,并在 SQuAD2.0 上显示出优于以前的工作的结果。