模型的生成模型:多样任务和资源限制下的 DNN 快速定制
生成人工智能在设计领域展示了巨大的潜力,但由于资源需求大,通常在大型计算基础设施上进行训练并作为云服务提供。在这篇立场论文中,我们考虑了在资源受限环境中进行生成人工智能设计的潜力、挑战和有希望的方法。这需要在模型压缩、高效算法设计和可能利用边缘计算方面创新,以使生成人工智能在低资源环境中高效运行。这些努力可以使先进技术普及,并促进可持续发展,确保普遍可及性和对人工智能驱动设计效益的环境考虑。
Feb, 2024
本研究提出了一种名为 “生成综合” 的新方法,它可以自动生成高度有效的深度神经网络架构,该方法可以广泛应用于移动和其他消费设备的边缘场景中,目的是加速和改进深度学习模型的构建,并提高模型效率和能源效率。
Sep, 2018
深度神经网络在移动和嵌入式平台上执行推理具有延迟、隐私和始终可用性等多个关键优势。然而,由于计算资源有限,有效地在移动和嵌入式平台上部署深度神经网络具有挑战性。本论文提出了一种结合了算法和硬件的运行时性能权衡管理方法,通过动态超网络实现了实时满足变化的应用性能目标和硬件约束。在实验中,我们的模型在 Jetson Xavier NX 的 GPU 上使用 ImageNet 数据集相对于最先进的方法,在相似的 ImageNet Top-1 准确率下速度提高了 2.4 倍,或在相似的延迟下准确率提高了 5.1%。同时,我们设计了一个分级运行时资源管理器,在单模型部署场景中达到了 19% 的能量降低和 9% 的延迟降低,在两个并发模型部署场景中能量降低了 89%,延迟降低了 23%。
Jan, 2024
本论文探讨了 DNN 在资源受限的边缘设备上部署的优化问题,并研究了四种边缘智能场景下的深度学习方法,通过减少 DNN 冗余度来达到资源消耗与模型准确度之间的平衡。
Oct, 2022
将生成式人工智能(GAI)与边缘计算网络结合,提出了生成式移动边缘网络的概念,并概述了广泛采用的 GAI 技术及其在移动边缘网络中的应用。在资源受限场景下,通过设计资源高效的方法、制定适当的激励机制以及利用生成扩散模型(GDMs)找到最优的激励机制解决方案,解决了生成式移动边缘网络面临的挑战。通过案例研究提出了一种模型分区的方法以实现智能任务卸载,并提出了基于 GDM 的 Stackelberg 模型来激励边缘设备为移动边缘智能提供计算资源。最后,提出了几个能够促进生成式移动边缘网络未来发展的方向。
Dec, 2023
提出了一种新的基于图的生成模型,将多个异构学习任务统一到同一框架中,通过将图卷积网络与多个变分自编码器相结合,在不同的任务上嵌入节点,从而成功提高了所有任务的性能,推动了现有先进方法的进步。
Nov, 2019
提出了 Edgent,这是一种协作和按需的 DNN 合作推理框架,其旨在通过在设备和边缘之间自适应地分配 DNN 计算来提高实时 DNN 推理的性能,并通过在适当的中间 DNN 层进行早期退出来加速 DNN 推理。
Jun, 2018
通过快速微调模型来适应生成样本与观察证据匹配是一种适用于各种深度生成模型和机器人环境的简单而通用的方法。该方法可应用于自回归模型和变分自动编码器,并在物体形状推断、逆运动学计算和点云完整性方面展现了其可用性。
Oct, 2023