强健的深度神经网络推理的部分权重适应

CVPRMar, 2020

强健的深度神经网络推理的部分权重适应

Partial Weight Adaptation for Robust DNN Inference

Xiufeng Xie, Kyu-Han Kim

TL;DRGearNN 是一种自适应的推理体系结构，它优化了少量的 “失真敏感” DNN 参数，根据输入的失真水平适应性地调整，从而提高了动态输入失真下 DNN 推理的准确性。

Abstract

Mainstream video analytics uses a pre-trained dnn model with an assumption that inference input and training data follow the same probability distribution. However, this assumption does not always hold in the wil

video analytics adaptivity dnn input distortion inference architecture

发现论文，激发创造

OneAdapt：通过反向传播实现深度学习应用的快速适应

通过优化配置选项以提高深度学习推理的准确性和降低网络带宽和 GPU 资源的使用量，本文提出了一种名为 OneAdapt 的方法，通过利用深度神经网络的可微性来快速估计准确度梯度，从而达到三个要求：最小化额外的 GPU 或带宽开销，基于数据对最终深度神经网络的准确性的影响达到接近最优的决策，并在一系列配置选项范围内实现这些目标。与现有技术相比，OneAdapt 在减少带宽和 GPU 使用量方面可达 15-59%，同时准确度保持相当或提高 1-5% 且使用相同或更少的资源。

Oct, 2023

高质量韧性深度神经网络

研究神经网络在图像分类中受质量失真的影响，提出了一种基于混合专家模型的解决方案，通过权重共享方式减少网络参数数量并提高性能。

Mar, 2017

金属铸造缺陷检测的高效神经网络方法

提出了一种轻量级的深度学习模型用于在钢铁制造行业中识别表面缺陷，与 MobileNet、Inception、ResNet 和 Vision transformers 等预训练卷积神经网络相比，该新模型具有更高的准确性和更快的推理速度，并采用了深可分离卷积，全局平均池化层和改进的架构高效性增强技术。

Aug, 2022

面向协作边缘平台的自适应工作负载分配用于重视准确性的深度神经网络推理

在本研究中，我们提出了一种自适应工作负载分配方法，联合考虑边缘设备的节点异构性以及应用特定的准确性和性能要求，通过组合优化异构感知的工作负载分割和动态准确配置 DNN 模型，以确保性能和准确度保证。我们在 Odroid XU4、Raspberry Pi4 和 Jetson Nano 板的边缘集群上进行了测试，并与最先进的工作负载分配策略相比，平均性能提升了 41.52%，输出准确度提升了 5.2%。

Oct, 2023

适应性 ResNet 架构用于资源受限的物联网系统中的分布式推理

本文通过实证研究，鉴定了 ResNet 中可舍弃的连接，以实现在资源不足情况下的分布式计算；同时，提出了一个多目标优化问题，旨在减少延迟、提高准确性；实验证明了自适应的 ResNet 架构可以在分布过程中减少共享数据、能耗和延迟，同时保持高准确性。

Jul, 2023

通过输入优化和模型微调构建对非分布式视觉数据的韧性

本文提出一种名为 Input Optimisation Network 的图像预处理模型来学习优化输入数据以适用于特定目标视觉模型，研究了在自动驾驶车辆的语义分割场景中，使用 Input Optimization 的解决方案比使用增强训练数据和对抗性预处理模型更具竞争力，并且结合使用 Input Optimization 网络和微调模型的联合优化方法达到了更好的性能表现。

Nov, 2022

EdgeMA: 为边缘设备上实时视频分析的模型适应系统

EdgeMA 是一个实际高效的视频分析系统，通过基于统计纹理特征的灰度共生矩阵提取和随机森林分类器检测领域转变，以及基于重要性加权的模型适应方法，解决了边缘设备上实时视频分析中数据漂移问题，并通过真实数据集的严格评估，结果表明 EdgeMA 显著提高了推理准确性。

Aug, 2023

双动态推断：实现更高效、自适应和可控的深度推断

提出一种双重动态推理框架，采用多粒度学习以及资源依赖的动态推理机制，优化计算资源和预测精度之间的权衡，有效降低计算资源消耗，通过实验验证其优越性。

Jul, 2019

面向云边协同推断的神经网络自动调谐量化框架

本论文阐述了在深度神经网络方面的云端和边缘协作推断在量化方面的优势，提出了一种基于自动调谐的神经网络量化框架，利用 ImageNet 数据集进行了混合精度合作推理的有效性研究，实验结果显示，该框架可以生成合理的网络分割，并减小移动设备上的存储消耗，同时能够保持较高的准确率。

Dec, 2018

面向低功耗计算机视觉的即时深度神经网络优化控制

移动设备上处理视觉数据具有多种应用，但现有的计算机视觉技术通常过于耗电无法部署在资源受限的边缘设备上。本文提出一种新技术，通过引入超参数来动态调整深度神经网络的精确度和能源消耗，无需重新训练即可适应不同边缘应用的硬件约束与精确度要求。该技术称为 AdaptiveActivation，实验证明其在流行的边缘设备上可以达到基准的误差范围内，并且比基准技术所需内存减少了 10% 到 38%，从而提供更多的精确度与效率权衡选项。

Sep, 2023