模型的生成模型：多样任务和资源限制下的 DNN 快速定制

Aug, 2023

模型的生成模型：多样任务和资源限制下的 DNN 快速定制

Generative Model for Models: Rapid DNN Customization for Diverse Tasks and Resource Constraints

Wenxing Xu, Yuanchun Li, Jiacheng Liu, Yi Sun, Zhengyang Cao...

TL;DRNN-Factory 是一个一站式框架，通过基于生成模型的方式，能够在不同的边缘场景中快速生成定制的轻量级模型，以满足边缘任务和资源限制的需求。

Abstract

Unlike cloud-based deep learning models that are often large and uniform, edge-deployed models usually demand customization for domain-specific tasks and resource-limited environments. Such →

edge-deployed models customization diverse edge scenarios generative model nn-factory

发现论文，激发创造

从云到边缘：重新思考针对低资源设计挑战的生成式人工智能

生成人工智能在设计领域展示了巨大的潜力，但由于资源需求大，通常在大型计算基础设施上进行训练并作为云服务提供。在这篇立场论文中，我们考虑了在资源受限环境中进行生成人工智能设计的潜力、挑战和有希望的方法。这需要在模型压缩、高效算法设计和可能利用边缘计算方面创新，以使生成人工智能在低资源环境中高效运行。这些努力可以使先进技术普及，并促进可持续发展，确保普遍可及性和对人工智能驱动设计效益的环境考虑。

Feb, 2024

FermiNets：通过生成合成学习生成式机器生成高效神经网络

本研究提出了一种名为 “生成综合” 的新方法，它可以自动生成高度有效的深度神经网络架构，该方法可以广泛应用于移动和其他消费设备的边缘场景中，目的是加速和改进深度学习模型的构建，并提高模型效率和能源效率。

Sep, 2018

可切换的决策：动态神经生成网络

通过动态分配计算资源来加速推理，我们的动态神经生成网络在问题回答、摘要和分类基准测试中表现出少量的计算成本，同时保持相同的准确性。

May, 2024

移动 / 嵌入式设备高效推理的动态深度神经网络和运行时管理

深度神经网络在移动和嵌入式平台上执行推理具有延迟、隐私和始终可用性等多个关键优势。然而，由于计算资源有限，有效地在移动和嵌入式平台上部署深度神经网络具有挑战性。本论文提出了一种结合了算法和硬件的运行时性能权衡管理方法，通过动态超网络实现了实时满足变化的应用性能目标和硬件约束。在实验中，我们的模型在 Jetson Xavier NX 的 GPU 上使用 ImageNet 数据集相对于最先进的方法，在相似的 ImageNet Top-1 准确率下速度提高了 2.4 倍，或在相似的延迟下准确率提高了 5.1%。同时，我们设计了一个分级运行时资源管理器，在单模型部署场景中达到了 19% 的能量降低和 9% 的延迟降低，在两个并发模型部署场景中能量降低了 89%，延迟降低了 23%。

Jan, 2024

边缘设备上实现深度学习

本论文探讨了 DNN 在资源受限的边缘设备上部署的优化问题，并研究了四种边缘智能场景下的深度学习方法，通过减少 DNN 冗余度来达到资源消耗与模型准确度之间的平衡。

Oct, 2022

6G 时代资源高效的移动边缘生成网络：基础、框架和案例研究

将生成式人工智能（GAI）与边缘计算网络结合，提出了生成式移动边缘网络的概念，并概述了广泛采用的 GAI 技术及其在移动边缘网络中的应用。在资源受限场景下，通过设计资源高效的方法、制定适当的激励机制以及利用生成扩散模型（GDMs）找到最优的激励机制解决方案，解决了生成式移动边缘网络面临的挑战。通过案例研究提出了一种模型分区的方法以实现智能任务卸载，并提出了基于 GDM 的 Stackelberg 模型来激励边缘设备为移动边缘智能提供计算资源。最后，提出了几个能够促进生成式移动边缘网络未来发展的方向。

Dec, 2023

基于图的异构多任务学习生成模型

提出了一种新的基于图的生成模型，将多个异构学习任务统一到同一框架中，通过将图卷积网络与多个变分自编码器相结合，在不同的任务上嵌入节点，从而成功提高了所有任务的性能，推动了现有先进方法的进步。

Nov, 2019

面向可适应优化算法的灵活准确性导向深度学习模块推断延迟预测框架

深度学习模型推理延迟预测的新框架和新方法 MEDN 在综合实验中展现了较高的准确性和 R 方值。

Dec, 2023

边缘智能：设备 - 边缘协同，按需深度学习模型协同推理

提出了 Edgent，这是一种协作和按需的 DNN 合作推理框架，其旨在通过在设备和边缘之间自适应地分配 DNN 计算来提高实时 DNN 推理的性能，并通过在适当的中间 DNN 层进行早期退出来加速 DNN 推理。

Jun, 2018

将生成模型微调作为机器人任务推理方法

通过快速微调模型来适应生成样本与观察证据匹配是一种适用于各种深度生成模型和机器人环境的简单而通用的方法。该方法可应用于自回归模型和变分自动编码器，并在物体形状推断、逆运动学计算和点云完整性方面展现了其可用性。

Oct, 2023