Aug, 2022

动态批量适应

TL;DR该研究提出了一种名为 “Dynamic Batch Adaptation” 的新训练过程,它可以基于梯度的方差等因素,动态选择每个样本的梯度子集来决定当前的更新步骤,这有效提高了模型的收敛速度和泛化能力。