Apr, 2024

Grad Queue: 强化稀疏梯度的概率框架

TL;DR使用在线梯度队列和聚类的机制来增强数据批次中的稀疏成分,提高大型批次更新中信息梯度的效果。通过测量梯度稀缺程度和聚类方法,该机制在最小化冲突成分的同时,增加了批次边界的优化,从而更好地接近最小值。该方法在 CIFAR10、MNIST 和 Reuters News 分类数据集上表现出了优越性能,相较于小批量梯度下降方法。