BriefGPT.xyz
大模型
Ask
alpha
关键词
bit-width
搜索结果 - 4
MixQuant:混合精度量化与位宽优化搜索
量化是一种用于创建高效深度神经网络的技术,可以通过以低于 32 位浮点精度的比特宽度执行计算和存储张量来减小模型大小和推理延迟,但量化可能导致舍入误差引起的数值不稳定性,降低量化模型的准确性,而 MixQuant 则是一种搜索算法,根据舍入
→
PDF
9 months ago
视觉变换器损失景观中的量化问题
使用进化搜索方法改进了通过渐进方法进行量化尺度优化的神经网络的性能,特别在极端量化情况下表现出鲁棒性。
PDF
10 months ago
ICCV
ResQ: 视频感知的剩余量化
通过低位量化的新视角以及引入时间依赖性,本文提出了一种视频网络的新的量化方案 Residual Quantization(ResQ),以降低冗余计算并提高准确性和比特位宽。此外,还通过动态调整比特位宽来适应视频中的变化,通过在语义分割和人体
→
PDF
a year ago
ECCV
CADyQ: 内容感知动态量化图像超分辨率
本文提出一种新型动态压缩方法 (CADyQ) 来优化图像超分辨率神经网络中由于量化引起的计算过于复杂的问题,通过在根据输入图像局部区域和图层进行自适应位宽和量化级别分配的可训练比特选择器模块中引入量化敏感性评估,以实现高平均位减少和更小的精
→
PDF
2 years ago
Prev
Next