Apr, 2020

利用检索句子生成模板的方式提高无监督问答

TL;DR我们提出了一种无监督训练QA模型的方法,该方法使用生成的伪数据训练,为QA训练生成问题,通过对相关检索到的句子应用简单模板,而非原始上下文句子来实现,从而使模型能够学习更复杂的上下文问题关系。 使用这些数据训练QA模型可在SQuAD数据集上获得14%的F1分数相对提高,并且在答案为命名实体时提高20%,从而实现无监督QA的最新性能。