Jun, 2024

面向设备上高效增量学习的中心敏感核优化

TL;DR为促进边缘智能在不断变化的环境中的发展,本文研究了在有限计算资源约束下的设备上的增量学习。与当前只关注高效训练而不考虑灾难性遗忘的方法不同,本文提出了一种简单而有效的面向边缘的增量学习框架,通过对神经网络的核心元素的知识强度的经验研究,发现中心核心对于学习新数据的知识强度最大化起关键作用,冻结其他核心元素可以在克服灾难性遗忘方面取得良好平衡。基于这一发现,我们进一步设计了一个便于梯度计算和反向传播的中心敏感核心优化框架,并提出了一种动态通道元素选择策略,以促进稀疏正交梯度投影以进一步减少优化复杂性。广泛的实验验证了我们的方法的高效性和有效性,例如,与现有的设备上训练方法相比,我们的方法在甚至更少的内存和近似计算的情况下实现了平均准确度提升 38.08%,表明其在设备上的增量学习方面具有显著潜力。