BriefGPT.xyz
Apr, 2024
Grad Queue: 强化稀疏梯度的概率框架
Grad Queue : A probabilistic framework to reinforce sparse gradients
HTML
PDF
Irfan Mohammad Al Hasib
TL;DR
使用在线梯度队列和聚类的机制来增强数据批次中的稀疏成分,提高大型批次更新中信息梯度的效果。通过测量梯度稀缺程度和聚类方法,该机制在最小化冲突成分的同时,增加了批次边界的优化,从而更好地接近最小值。该方法在 CIFAR10、MNIST 和 Reuters News 分类数据集上表现出了优越性能,相较于小批量梯度下降方法。
Abstract
informative gradients
are often lost in large batch updates. We propose a robust mechanism to reinforce the
sparse components
within a random batch of data points. A finite queue of online gradients is used to de
→