BriefGPT.xyz
大模型
Ask
alpha
关键词
resource-constrained mobile devices
搜索结果 - 2
MixDQ: 高效节省内存的几步文本到图像扩散模型与度量分离混合精度量化
通过开发一种混合精度量化框架 MixDQ,我们针对强敏感度文本嵌入进行专门的 BOS 感知量化方法设计,通过度量解耦灵敏度分析来衡量每一层的敏感度,最后通过基于整数规划的方法进行位宽分配,与现有的量化方法相比,MixDQ 在保持 W8A8
→
PDF
a month ago
RepViT-SAM:面向实时分割任意物体
为了在资源受限的移动设备上实现实时分割任何物体,本文使用了 RepViT-SAM 模型,代替了 SAM 中的重型图像编码器,得到了具有显著改进的零样本迁移能力和近 10 倍更快推理速度。
PDF
7 months ago
Prev
Next