强健的深度神经网络推理的部分权重适应
通过优化配置选项以提高深度学习推理的准确性和降低网络带宽和 GPU 资源的使用量,本文提出了一种名为 OneAdapt 的方法,通过利用深度神经网络的可微性来快速估计准确度梯度,从而达到三个要求:最小化额外的 GPU 或带宽开销,基于数据对最终深度神经网络的准确性的影响达到接近最优的决策,并在一系列配置选项范围内实现这些目标。与现有技术相比,OneAdapt 在减少带宽和 GPU 使用量方面可达 15-59%,同时准确度保持相当或提高 1-5% 且使用相同或更少的资源。
Oct, 2023
提出了一种轻量级的深度学习模型用于在钢铁制造行业中识别表面缺陷,与 MobileNet、Inception、ResNet 和 Vision transformers 等预训练卷积神经网络相比,该新模型具有更高的准确性和更快的推理速度,并采用了深可分离卷积,全局平均池化层和改进的架构高效性增强技术。
Aug, 2022
在本研究中,我们提出了一种自适应工作负载分配方法,联合考虑边缘设备的节点异构性以及应用特定的准确性和性能要求,通过组合优化异构感知的工作负载分割和动态准确配置 DNN 模型,以确保性能和准确度保证。我们在 Odroid XU4、Raspberry Pi4 和 Jetson Nano 板的边缘集群上进行了测试,并与最先进的工作负载分配策略相比,平均性能提升了 41.52%,输出准确度提升了 5.2%。
Oct, 2023
本文通过实证研究,鉴定了 ResNet 中可舍弃的连接,以实现在资源不足情况下的分布式计算;同时,提出了一个多目标优化问题,旨在减少延迟、提高准确性;实验证明了自适应的 ResNet 架构可以在分布过程中减少共享数据、能耗和延迟,同时保持高准确性。
Jul, 2023
本文提出一种名为 Input Optimisation Network 的图像预处理模型来学习优化输入数据以适用于特定目标视觉模型,研究了在自动驾驶车辆的语义分割场景中,使用 Input Optimization 的解决方案比使用增强训练数据和对抗性预处理模型更具竞争力,并且结合使用 Input Optimization 网络和微调模型的联合优化方法达到了更好的性能表现。
Nov, 2022
EdgeMA 是一个实际高效的视频分析系统,通过基于统计纹理特征的灰度共生矩阵提取和随机森林分类器检测领域转变,以及基于重要性加权的模型适应方法,解决了边缘设备上实时视频分析中数据漂移问题,并通过真实数据集的严格评估,结果表明 EdgeMA 显著提高了推理准确性。
Aug, 2023
提出一种双重动态推理框架,采用多粒度学习以及资源依赖的动态推理机制,优化计算资源和预测精度之间的权衡,有效降低计算资源消耗,通过实验验证其优越性。
Jul, 2019
本论文阐述了在深度神经网络方面的云端和边缘协作推断在量化方面的优势,提出了一种基于自动调谐的神经网络量化框架,利用 ImageNet 数据集进行了混合精度合作推理的有效性研究,实验结果显示,该框架可以生成合理的网络分割,并减小移动设备上的存储消耗,同时能够保持较高的准确率。
Dec, 2018
移动设备上处理视觉数据具有多种应用,但现有的计算机视觉技术通常过于耗电无法部署在资源受限的边缘设备上。本文提出一种新技术,通过引入超参数来动态调整深度神经网络的精确度和能源消耗,无需重新训练即可适应不同边缘应用的硬件约束与精确度要求。该技术称为 AdaptiveActivation,实验证明其在流行的边缘设备上可以达到基准的误差范围内,并且比基准技术所需内存减少了 10% 到 38%,从而提供更多的精确度与效率权衡选项。
Sep, 2023