Jul, 2023

通过次线性激活神经元识别来实现高效 SGD 神经网络训练

TL;DR本文提出了基于静态半空间报告数据结构的神经网络训练方法,通过几何搜索实现亚线性时间的激活神经元识别,并证明该算法可以在 O (M^2/ε^2) 的时间内收敛,其中 M 是系数范数上限,ε 是误差项。