ICLRFeb, 2022

DropIT:为内存高效的深度神经网络训练丢弃中间张量

TL;DR该研究提出了一种名为 DropIT 的方法,该方法可以通过删除中间张量元素来提高深度神经网络训练的效率和精确性。实验表明,DropIT 方法可以在较高的测试精度下,删除全连接和卷积层中多达 90%的中间张量元素,以及在不同任务中(例如分类、目标侦测、实例分割)的视觉变换器和卷积神经网络上实现更快的训练收敛。