Oct, 2023

OneAdapt:通过反向传播实现深度学习应用的快速适应

TL;DR通过优化配置选项以提高深度学习推理的准确性和降低网络带宽和 GPU 资源的使用量,本文提出了一种名为 OneAdapt 的方法,通过利用深度神经网络的可微性来快速估计准确度梯度,从而达到三个要求:最小化额外的 GPU 或带宽开销,基于数据对最终深度神经网络的准确性的影响达到接近最优的决策,并在一系列配置选项范围内实现这些目标。与现有技术相比,OneAdapt 在减少带宽和 GPU 使用量方面可达 15-59%,同时准确度保持相当或提高 1-5% 且使用相同或更少的资源。