May, 2020

使用各向同性批量归一化Fine-Tuning BERT

TL;DR本文研究了预训练语言模型中的同向性问题,提出了一种新的网络正则化方法:同向批量归一化(IsoBN),用于解决优化学习中掌握主要因素的问题,从而获得更多同向表现,提高了七项自然语言理解任务约1.0的绝对增量。