- 在 NVIDIA Jetson Nano 上为实时系统进行深度学习模型基准测试:一项实证研究
研究了在低计算能力和低内存设备上部署复杂的深度学习模型的优化方法以提高推断速度,证明了硬件特定的模型优化能够有效降低能源消耗和碳足迹。
- 基于脉冲神经网络的嵌入式事件驱动目标检测
利用 SPLEAT 加速器的嵌入式神经形态测试台成功地在可嵌入设备上训练、评估、量化和部署了脉冲神经网络,通过加载最新的神经网络解决方案,估计了在专门设计的低功耗脉冲神经网络硬件上部署网络所带来的性能损失,并在神经形态硬件上实现了真实世界的 - 利用边缘计算硬件控制混沌
使用机器学习创建数字孪生提供了一种数据驱动的方法,可预测系统行为,而通过采用下一代储层计算的非线性控制器,此模型能够解决控制混沌系统到任意时变状态的难题,并能在嵌入式设备上进行评估,为向计算边缘部署高效的机器学习算法迈出了第一步。
- METER:用于单目深度估计的移动视觉变换器架构
深度估计是自主系统评估自身状态和感知周围环境所需的基本知识。本文提出了一种新的轻量级视觉变换器架构 METER,用于嵌入式设备上的单目深度估计,能够在 NVIDIA Jetson TX1 和 NVIDIA Jetson Nano 等受限硬件 - 时间决策:利用时间相关性进行早期退出神经网络的高效决策
利用差异检测和时间耐心作为早期中止神经网络的决策机制,可以显著降低计算资源占用,同时保持较高的准确率。这些研究结果强调了考虑传感器数据中的时间相关性以改进终止决策的重要性。
- 极弱设备上的实时神经网络推断:可解释人工智能的灵活卸载
通过利用 `eXplainable AI` 技术,在训练阶段明确强制规定特征的稀疏性,并最小化在线计算和通信开销,以实现弱嵌入式设备上的实时神经网络推断。
- 基于机器学习的物联网设备控制流数据的恶意软件检测
通过机器学习算法和逆向工程工具提供更好的安全性,研究文中探讨了控制流相关数据在恶意软件检测中的适用性,并提出了一个包含两个阶段的恶意软件检测方法。
- 低资源设备上的关键词检测中的在线连续学习通过高阶时序统计的池化
嵌入式设备上的关键词检测模型需要快速适应新用户定义的词汇,同时不会遗忘之前的词汇。为此,我们提出了一种新的方法 ——Temporal Aware Pooling (TAP),用于构建丰富的特征空间,通过计算预先训练主干架构提取的语音特征的高 - 基于令牌共享 Transformer 的轻量级单目深度估计
提出了一种使用 Transformer 来进行单目深度估计的 Token-Sharing Transformer(TST)架构,该架构通过全局令牌共享,在嵌入式设备中达到高吞吐量的准确深度预测,并在 NYU Depth v2 数据集上优于现 - eWaSR - 一种嵌入式计算就绪的海上障碍物检测网络
本文提出了一种嵌入式端可用的 eWaSR 网络,采用最新的基于转换器的轻量级网络,相比于最优性能 WaSR 的 F1 得分下降仅为 0.52%,并且胜过其他最先进的嵌入式网络,使得该网络是第一个实用的嵌入式海上障碍物检测网络。
- 基于 PPG 的心率估计:高效的传感器采样与学习模型
本文探讨了低功耗和资源受限的嵌入式设备中更适用于心率估计技术。作者们将信号处理和机器学习相结合,将 PPG 采样频率从 125Hz 降低到 25Hz 以提高准确性,缩小模型大小并加快推理时间。实验结果表明,DT 模型使用 10 至 20 个 - TinyML 综述
本文探讨了如何将机器学习算法应用于低功耗廉价的物联网设备中,TinyML 作为将深度神经网络模型部署到嵌入式系统上的交叉领域,将为边缘服务和应用程序铺平道路。
- 基于 MobileNetV3 的农业病害快速识别方法改进
本文介绍了基于 MobileNetV3 的 Coordinate Attention 块来解决农业害虫和疾病识别模型过重难以应用的问题,在减小模型体积和提高模型准确率的基础上,成功将模型部署到 Jetson Nano 上,可为其他嵌入式设备 - CVPR用于学习图像压缩的身份保持损失
提出了一种端到端的图像压缩框架,通过学习特定于领域的特征来实现比标准 HEVC / JPEG 压缩技术更高的压缩比,同时保持下游任务(例如识别)的准确性,该框架适用于嵌入式设备和云计算领域,并在面部识别领域的数据集上获得较好表现。
- 嵌入式设备的在线持续学习
本文研究了使用移动神经网络进行实时嵌入式设备上的在线连续学习的效果,通过测量它们的性能、内存使用、计算要求和对域外输入的泛化能力,验证了实时在设备上执行学习的有效性。
- MMBEANNA: 用于神经网络加速的二进制能力架构
该研究提出并评估了一种用于神经网络加速的二进制启用体系结构(BEANNA),该体系结构采用 16x16 systolic array 矩阵乘法器和可同时处理浮点数和二进制乘加的处理单元。该体系结构可以在高精度浮点数和二进制网络层之间无缝切换 - CVPR二元图神经网络
本论文探讨了将二值化技术应用于图神经网络的方法,并成功设计了能够在 Hamming 空间内快速构建动态图的模型,实现了在准确性轻微损失的代价下在嵌入式设备上取得了显著的存储空间和时间扩展的效果。
- TensorFlow Lite Micro: 嵌入式 TinyML 系统上的机器学习
介绍了一个名为 TensorFlow Lite Micro (TF Micro) 的开源机器学习推理框架,它采用基于解释器的独特方法,旨在解决嵌入式系统资源限制和碎片化挑战等问题。此框架具有低资源需求和最小的运行时性能开销。
- CVPR面向嵌入式设备的辅助多任务训练高效 2.5D 手部姿态估计
本研究介绍了在嵌入式设备上部署高效率 2.5D 手部姿势估计所需的数据、架构和训练过程,提出了标签和增强策略,并综合多模块网络构件和辅助多任务训练策略实现了与 MobileNetV2 相当性能的模型。该模型具有小的内存占用和高效的计算能力。
- 相同但不同 - 通过权重因式分解恢复神经网络量化误差
本研究利用神经网络中存在的某种自由度,提出了一种基于因式分解的量化神经网络的方法,并证明正确的因式分解能够显著降低量化神经网络的性能损失,在多个网络上取得了最佳效果。