AAAINov, 2019

TANDA:用于答案句子选择的预训练 Transformer 模型的转移和适应

TL;DR提出了 TANDA 方法,该方法在自然语言任务中对预训练 Transformer 模型进行微调,通过利用大规模的高质量数据集将预训练模型传输到通用任务模型中,然后进行第二步微调以适应目标领域。在回答句子选择方面,我们建立了一个大规模的数据集来启用传输步骤,表明 TANDA 与 WikiQA 和 TREC-QA 等基准相比具有更高的 MAP 分数。TANDA 生成更稳定且鲁棒性更强的模型并降低了选择最佳超参数所需的工作量。