ACLMar, 2022

在 IID、OOD 和对抗环境中研究不同任务的选择性预测方法

TL;DR本研究通过对多个 NLP 任务的 17 个数据集进行实验表明,对于具有选择性预测能力的 NLP 系统,尽管其利用了额外的资源,但现有的方法并不能始终在所有数据领域(IID), 数据领域外(OOD)和对抗性(ADV)的场景下显着优于最简单的基线 'MaxProb',且这些方法的表现在任务之间的转化性不好,因此建议应该跨任务和场景评估未来的选择性预测方法以可靠地评估它们的能力。