May, 2022

LeRaC:学习率课程

TL;DR本文提出了一种名为 Learning Rate Curriculum(LeRaC)的课程学习方法,使用不同的学习率来创建数据 - free 课程,在课程学习的初始训练时期,将更高的学习率分配给靠近输入的神经层,逐渐降低学习率。 为了实验验证,本文使用了从计算机视觉(CIFAR-10,CIFAR-100,Tiny ImageNet),语言(BoolQ,QNLI,RTE)和音频(ESC-50,CREMA-D)领域中的 8 个数据集,考虑了各种卷积(ResNet-18,Wide-ResNet-50,DenseNet-121),循环(LSTM) )和变压器(CvT,BERT,SepTr)架构,将该方法与常规的训练策略和 Curriculum by Smoothing(CBS)方法进行了比较。