BriefGPT.xyz
大模型
Ask
alpha
关键词
on-device deployment
搜索结果 - 5
CVPR
EdgeFusion:设备端文本到图像生成
通过对稳定扩散(SD)的高效计算负担进行改进,我们提出了两种策略,即利用先进的生成模型和为 LCM 定制的先进蒸馏流程,通过量化、剖析和资源有限的边缘设备上的部署,实现了在仅两步、低于一秒的延迟下,生成具有照片写实风格、与文本对齐的图像。
PDF
3 months ago
ICML
移动设备上大规模扩散模型的压缩
本文介绍了基于 TensorFlow Lite 部署 Diffusion 模型的挑战和解决方案,并展示了使用 Mobile Stable Diffusion 在 Android 设备上生成 512x512 图像所需的推理延迟小于 7 秒。
PDF
a year ago
速度即一切:通过 GPU 感知优化在设备上加速大型扩散模型
本文介绍了一种优化了的基础模型,通过在移动设备上实施优化,使大规模扩散模型的推理延迟得到了显著缩短,从而提高了生成性 AI 的适用性并改善了用户体验。
PDF
a year ago
ICML
具有多目标贝叶斯优化的延迟感知神经架构搜索
使用贝叶斯优化方法,探索了在机器学习模型中,构架和超参数的调节与所得准确性与延迟之间的平衡方法。
PDF
3 years ago
Bit-Mixer: 运行时位宽选择的混合精度网络
本文提出了 Bit-Mixer 方法,为高度精准预测训练多量化层的混合精度网络,在测试期间任何层都可以改变自己的比特宽度,并通过 “转换批量归一化” 和 3 阶段优化,展示了网络的训练过程以及具有理想的灵活性属性的混合精度网络可供设备部署,
→
PDF
3 years ago
Prev
Next