神经网络动态推理的早期分类
本研究介绍了一种多输出深度神经网络,它具有提高推理速度、减少过拟合以及利用多层次计算平台的优势,并描述了在 5G 和雾计算环境中的应用场景以及相关的开放式研究问题。
Apr, 2020
本研究提出了一种基于多目标学习的多出口深度神经网络推理框架 EENet,以优化在给定推理预算下的早期退出策略。 EENet 早期退出调度程序优化测试样本分配到不同退出,同时选择退出效用阈值,以满足给定的推理预算,同时最大化性能指标。与现有代表性早期退出技术相比,EENet 可以显着提高性能。
Jan, 2023
大型预训练模型与微调相结合,在机器学习中逐渐成为主要的架构。早期退出动态神经网络(EDNN)通过允许模型从中间层进行预测(即早期退出),绕过了每个推理所需的资源过多的限制。我们提出了一种连接这两个模块的新型架构,这在分类数据集上带来了显著的性能提升,并且具有更好的不确定性特征。
Oct, 2023
本文介绍一种新颖的深度网络架构 ——BranchyNet,该架构通过引入额外的支路分类器,允许预测结果提前退出网络,实现较高置信度下的快速推理,以此同时提高网络的分类准确度,并有效地降低网络的推理时间。
Sep, 2017
本文提出了一种早期预测机制 'Exit Predictor',通过引导某些明显 “困难” 的数据样本绕过早期出口的计算,从而降低设备边缘混合推理系统中早期退出网络的设备计算负担。同时,还考虑了通信带宽的变化,在延迟感知的边缘推理中通过几个简单的回归模型来调整 Exit Predictor 的预测阈值和早期退出网络的置信度阈值,以适应不同带宽条件下推理的需求。实验结果表明,Exit Predictor 对于早期退出网络在准确性和设备计算负担之间取得更好的折衷效果。与基线方法相比,在不同带宽条件下,提出的延迟感知的边缘推理方法具有更高的推理准确性。
Jun, 2022
协作推理系统是在无线网络边缘部署深度神经网络的新兴解决方案之一。本研究工作通过评估不同的传输决策机制,实验证明在无线边缘上适当利用早期退出可以在图像分类任务中提供性能增益和显著的通信节省。
Nov, 2023
本文提出了一种基于样本加权的训练策略,用于桥接训练与测试时 Early exiting 行为的差距,通过联合优化权重预测网络和网络主干模型,在训练期间模拟其在推理期间的自适应行为,从而提高分类准确度和推理效率的权衡。
Sep, 2022