Aug, 2023

面向高效图像识别的低延迟统一动态网络

TL;DR动态计算已成为提高深度网络推理效率的一种有前途的方法,我们提出了一个名为 “LAUDNet” 的框架,它集成了三个主要的动态范例,以缩短模型的延迟,通过算法设计与调度优化相结合,准确衡量动态操作延迟的潜在预测器指导。我们在多个视觉任务上测试了 LAUDNet,其在 V100、RTX3090 和 TX2 GPU 上能够显著降低 ResNet-101 等模型的延迟超过 50%,而且在准确性和效率之间取得良好的平衡。