Dec, 2023

动态训练和可定制推断的弹性神经网络

TL;DR通过动态神经网络的方法,我们提出了一种训练大型网络并在推理阶段从中提取子网络的简单方式,以满足模型尺寸或复杂性约束,实验证明该方法可以在单个大型模型中显著缩短训练时间,并在不同子网络尺寸和复杂性上有效提高分离性能。