Jun, 2024

BitsFusion:扩散模型的1.99位权重量化

TL;DR通过开发一种新的权重量化方法,将稳定扩散 v1.5 的 UNet 模型量化为 1.99 位,实现模型尺寸减小7.9倍,同时展现更好的生成质量。