Jun, 2020

AdaS:自适应调度随机梯度

TL;DR本文提出了一种名为 “自适应调度” 的算法,该算法利用奇异值得出的两个指标 “知识增益” 和 “映射条件”,并将 SGD 学习率与知识增益的变化率成比例地调整,实验表明该算法具有更快的收敛速度和更好的泛化性能。