Oct, 2022

在应用主动学习于 Transformer 模型时,要使用 Softmax 还是不使用 Softmax:这是一个问题

TL;DR本文研究了活性学习的策略及其所用到的模型预测的置信度度量。通过对七个数据集中 8 种排除离群值的策略进行实验,发现大多数方法过于依赖寻找最不确定的样本(离群值),导致只标记离群值反而表现更差,文中提出一种方法对样本进行系统性忽略,在多种方法上相对 softmax 函数获得了更好的效果。