最大推理准确性和能效的选择性任务卸载用于实时物联网感知系统

Feb, 2024

最大推理准确性和能效的选择性任务卸载用于实时物联网感知系统

Selective Task offloading for Maximum Inference Accuracy and Energy efficient Real-Time IoT Sensing Systems

Abdelkarim Ben Sada, Amar Khelloufi, Abdenacer Naouri, Huansheng Ning, Sahraoui Dhelim

TL;DR通过提出轻量级混合遗传算法来解决小型推理模型在边缘设备上动态分配推理任务以最大化推理准确度的问题，并与其他演化方法进行比较。

Abstract

The recent advancements in small-size inference models facilitated AI deployment on the edge. However, the limited resource nature of edge devices poses new challenges especially for →

small-size inference models edge devices real-time applications inference accuracy hybrid genetic algorithm

发现论文，激发创造

边缘智能优化大型语言模型推断 —— 批处理和量化

通过部署批处理技术和资源有限的边缘设备上的模型量化，我们在此论文中提出了一种针对基于 Transformer 解码器的大语言模型推断的边缘智能优化问题，旨在通过批处理调度和通信、计算资源的联合分配来最大化推断吞吐量，同时考虑边缘资源约束和不同用户对延迟和准确性的需求。为了解决这个 NP-hard 问题，我们开发了一种在可行时间复杂度内运行的带有在线树剪枝的最优深度优先搜索算法（DFTSP）。模拟结果表明，DFTSP 在各种用户设置和量化技术中超越了其他批处理基准，并且与蛮力搜索方法相比，它的时间复杂度降低了 45% 以上。

May, 2024

基于多智能体强化学习的工业 AIGC 服务在无线边缘网络上的卸载

提出了一种基于生成模型的工业 AIGC 协同边缘学习框架，通过利用真实样本合成和基于边缘的优化功能，实现高效的少样本学习，包括多任务 AIGC 计算卸载模型和注意力增强的多智能体强化学习算法，最终实现了边缘化 AIGC 任务完成的系统延迟优化。

May, 2024

一种高效的任务卸载优化框架，用于基于智能反射面的多接入边缘计算系统

本文提出了一个基于深度学习的优化框架（IOPO），可以在毫秒之内生成高效节能的任务卸载决策，并且在处理解决方案空间广泛的复杂问题时，相较于其他基准方法性能更优。

Jul, 2023

面向互联车辆的集成边缘云计算中多请求卸载的 QoS-SLA 感知自适应遗传算法

该论文提出一种基于人工智能的 QoS-SLA-aware 自适应遗传算法，包括车辆的速度和多请求处理重叠的影响，以优化异构边缘云计算系统中多请求卸载应用的执行时间。与基于随机卸载和基线基因法相比，实验结果表明该算法可以平均提高 1.22 倍的请求数执行速度，并减少 59.9％的 SLA 违规。

Jan, 2022

深度学习应用中的分层推理在线算法

研究了嵌入小型机器学习模型的资源受限边缘设备与托管大型机器学习模型的边缘服务器之间的 Hierarchical Inference 策略，提出了在线元学习框架，以预测小型模型的分类猜测正确性，并使用四个数据集对其性能进行了评估。

Apr, 2023

通过选择性边缘执行改善物联网分析

本研究旨在提高 IoT 设备分析数据的性能，通过使用边缘计算服务器来增强分析，具体使用算法进行优化，使得可以智能地利用云端服务满足需求

Mar, 2020

边缘云多用户推理编排的在线学习

我们提出了一种基于强化学习的计算卸载解决方案，它可以在考虑首选深度学习模型选择技术的情况下学习最佳卸载策略，以最小化响应时间同时提供足够的准确性，我们的解决方案在 AWS 和 ARM 核心配置的多个实现中提供 35％的加速，并且最少仅有 0.9％的准确性降低，展示了我们在线学习框架在边缘计算及联云系统中编配深度学习推理的潜力。

Feb, 2022

边缘计算网络中的 AI 生成内容服务的卸载与质量控制

提出了一种联合优化算法，用于解决在边缘计算范式中对 AI 生成内容模型和卸载决策的优化问题，并通过实验证明所提算法在联合优化性能上优于基准方法。

Dec, 2023

面向边缘智能的移动性和成本感知推理加速算法

针对边缘智能化中的模型切割和资源分配存在的问题，我们提出了一种移动和成本感知的模型切割和资源分配算法，用于加速边缘推理。具体来说，在无用户移动的场景中，提供了循环迭代梯度下降（Li-GD）算法；而在存在用户移动的场景中，提出了移动感知的 Li-GD（MLi-GD）算法，以计算最优策略。实验结果证明了提出算法的有效性。

Dec, 2023

HeteroEdge: 解决异构协作自主系统中的不对称问题

本文提出了一个用于优化深度学习算法输入、模型推理通信、深度学习算法的自适应优化框架，并通过评估表明，将数据的 70% 分配给辅助结点可以最小化离线延迟，节约总操作时间。

May, 2023