Jun, 2023

精简卓越模型

TL;DR该论文关注将大型神经网络进行压缩的任务,并比较了各种参数和神经元选择的方法,其中一种新的选择方法 OBD-SD 表现最佳。同时,研究结果表明对于神经元层的压缩,从头开始训练的效果更好。