Oct, 2022

使用似然拆分测试长尾泛化

TL;DR为了可靠地处理自然语言,NLP 系统必须推广到罕见话语的长尾中。我们提出了一种方法,通过重新拆分现有数据集来创建具有挑战性的基准,要求推广到分布的尾部。在这个简单的方法中,我们创建了一个 “似然分布分割”,把通过一个预先训练的语言模型(LM)分配较低概率的例子放在测试集中,而更有可能的例子放在训练集中。这种方法可以量身定制,为广泛的任务构建有意义的训练 - 测试分割。同时,似然分配比随机分割更具挑战性。此外,似然分配比对抗性过滤创建了更公平的基准;当使用 LM 创建分配时,我们的分割不会对 LM 产生不利的惩罚。