Oct, 2022

重新审视结构化 Dropout

TL;DR本文研究使用多个有构造性的 Dropout 方法在多个现代神经网络上进行自然语言处理和计算机视觉任务。我们提出了一种名为 ProbDropBlock 的方法,该方法可以提高模型的性能,并且已经在 RoBERTa 和 ImageNet 上得到验证。