Apr, 2020

Gestalt: SQuAD2.0 的叠加集合

TL;DR本文提出了一种基于深度学习的系统,在 SQuAD2.0 任务中,通过对话段落来寻找或指示问题的正确答案,它可以学习一个异构 SQuAD2.0 模型的集合,在进行合适的融合后,能够胜过单个最佳模型。我们创造了一种堆叠集合,将两个基于 ALBERT 和 RoBERTa 的模型的前 N 个预测组合成一个多类分类任务,以从它们的预测中选择最佳答案。我们研究了各种集合配置、输入表示和模型架构。在评估中,我们检查了测试集 EM 和 F1 得分;我们最好的表现集合结合了基于 CNN 的元模型,在 EM 和 F1 得分方面分别得分为 87.117 和 90.306,相对于基线表现最佳的模型(一个基于 ALBERT 的模型)的 86.644 和 89.760,分别提高了 0.55% 和 0.61%。