ACLApr, 2021

BERT 所执行的首要处理的确定因素

TL;DR通过探索神经模型对下游任务的表现能力以及它们的激活模式,我们发现在比较神经网络的表现时,预测结果的语境长度可能是其间的文献中一个中介因素,需要加以控制才能得到准确的结论。本研究以 BERT 为例,发现在操纵探测数据集的语境长度分布时,可能会出现 196 种不同的模型排序方式。因此,我们总结出了未来探索神经网络表现的最佳实践方法。