Jul, 2019

预见优化器:向前 k 步,向后 1 步

TL;DR该论文提出了一种新的优化算法Lookahead,针对目前普遍使用的SGD和Adam优化算法进行了改进,能够提高学习的稳定性和性能表现。