Mar, 2020

预训练转换器的校准

TL;DR通过对BERT和RoBERTa在自然语言推理、释义检测和常识推理三方面的实验,本研究发现预训练模型在领域内使用时具有校准性,而且与基准相比,在领域外的校准误差可以低至3.5倍;降温和标签平滑等方法可以进一步减少领域内的校准误差和校准领域外的计算后验概率。