Jan, 2021

预训练跨度选择的少样本问题回答

TL;DR在几个问答基准测试中,经过Fine-Tuning后,预训练模型已经达到了与人类相当的水平。然而我们研究了更为现实的少样本情况,发现标准的模型表现不佳,由此突出了当前预训练目标与问答之间的差异。为此我们提出了一种新的问答针对性预训练方案:Recurring Span Selection,该方案非常适合处理具有多个重复区域的段落,并在提供的数据量很少的情况下在SQuAD的基准测试中取得了令人惊讶的高成绩(例如仅使用128个训练示例时即可获得72.7 F1的成绩),同时保持了在高资源设置下具有相当的性能。