Jun, 2024

BitsFusion:扩散模型的 1.99 位权重量化

TL;DR通过开发一种新的权重量化方法,将稳定扩散 v1.5 的 UNet 模型量化为 1.99 位,实现模型尺寸减小 7.9 倍,同时展现更好的生成质量。