AAAINov, 2022

通过训练表示对齐学习紧凑特征

TL;DR本研究提出了一种名为 In-Training Representation Alignment (ITRA) 的方法,通过匹配损失函数,显式地对两个不同 mini-batch 的 feature distribution 进行校准,从而稳定随机梯度下降(SGD)中高方差的情况,并提出了其对特征表示学习的良好效果的分析,大规模实验表明该方法在图像和文本分类方面优于传统方法。