最大推理准确性和能效的选择性任务卸载用于实时物联网感知系统
通过部署批处理技术和资源有限的边缘设备上的模型量化,我们在此论文中提出了一种针对基于 Transformer 解码器的大语言模型推断的边缘智能优化问题,旨在通过批处理调度和通信、计算资源的联合分配来最大化推断吞吐量,同时考虑边缘资源约束和不同用户对延迟和准确性的需求。为了解决这个 NP-hard 问题,我们开发了一种在可行时间复杂度内运行的带有在线树剪枝的最优深度优先搜索算法(DFTSP)。模拟结果表明,DFTSP 在各种用户设置和量化技术中超越了其他批处理基准,并且与蛮力搜索方法相比,它的时间复杂度降低了 45% 以上。
May, 2024
提出了一种基于生成模型的工业 AIGC 协同边缘学习框架,通过利用真实样本合成和基于边缘的优化功能,实现高效的少样本学习,包括多任务 AIGC 计算卸载模型和注意力增强的多智能体强化学习算法,最终实现了边缘化 AIGC 任务完成的系统延迟优化。
May, 2024
本文提出了一个基于深度学习的优化框架(IOPO),可以在毫秒之内生成高效节能的任务卸载决策,并且在处理解决方案空间广泛的复杂问题时,相较于其他基准方法性能更优。
Jul, 2023
该论文提出一种基于人工智能的 QoS-SLA-aware 自适应遗传算法,包括车辆的速度和多请求处理重叠的影响,以优化异构边缘云计算系统中多请求卸载应用的执行时间。与基于随机卸载和基线基因法相比,实验结果表明该算法可以平均提高 1.22 倍的请求数执行速度,并减少 59.9%的 SLA 违规。
Jan, 2022
研究了嵌入小型机器学习模型的资源受限边缘设备与托管大型机器学习模型的边缘服务器之间的 Hierarchical Inference 策略,提出了在线元学习框架,以预测小型模型的分类猜测正确性,并使用四个数据集对其性能进行了评估。
Apr, 2023
我们提出了一种基于强化学习的计算卸载解决方案,它可以在考虑首选深度学习模型选择技术的情况下学习最佳卸载策略,以最小化响应时间同时提供足够的准确性,我们的解决方案在 AWS 和 ARM 核心配置的多个实现中提供 35%的加速,并且最少仅有 0.9%的准确性降低,展示了我们在线学习框架在边缘计算及联云系统中编配深度学习推理的潜力。
Feb, 2022
提出了一种联合优化算法,用于解决在边缘计算范式中对 AI 生成内容模型和卸载决策的优化问题,并通过实验证明所提算法在联合优化性能上优于基准方法。
Dec, 2023
针对边缘智能化中的模型切割和资源分配存在的问题,我们提出了一种移动和成本感知的模型切割和资源分配算法,用于加速边缘推理。具体来说,在无用户移动的场景中,提供了循环迭代梯度下降(Li-GD)算法;而在存在用户移动的场景中,提出了移动感知的 Li-GD(MLi-GD)算法,以计算最优策略。实验结果证明了提出算法的有效性。
Dec, 2023
本文提出了一个用于优化深度学习算法输入、模型推理通信、深度学习算法的自适应优化框架,并通过评估表明,将数据的 70% 分配给辅助结点可以最小化离线延迟,节约总操作时间。
May, 2023