BriefGPT.xyz
大模型
Ask
alpha
关键词
inference computation
搜索结果 - 4
CVPR
即插即用扩散蒸馏
我们提出了一种新的蒸馏方法,可以减少迭代计算过程中无需分类器指导的扩散模型的推理计算时间,并且只需要基础模型的 1%的可训练参数,同时还能维持生成图像的视觉逼真度。
PDF
a month ago
自选注意力范围加速大型语言模型推理
训练大型语言模型自我选择注意力跨度可以加快解决现实世界任务的自回归推理速度。
PDF
3 months ago
ReLU 反击:在大型语言模型中利用激活稀疏性
这篇论文研究了大语言模型在资源受限设备上推断计算中的挑战与改进方法,通过重新引入 ReLU 激活函数并探索其稀疏模式,作者提出了一种实用的策略,可以显著减少推断计算量,达到三倍的性能提升。
PDF
9 months ago
移动网络中量化友好的可分离卷积
本文分析了 MobileNetV1 量化造成的精度损失问题,并提出了一种友好于量化的可分离卷积架构,经 ImageNet2012 数据集测试,我们改进后的 MobileNetV1 模型能够以 8 位推理精度达到 68.03%,几乎与其浮点精
→
PDF
6 years ago
Prev
Next