Jun, 2024

Q-DiT:扩散变压器的准确后训练量化

TL;DRQ-DiT 是一种结合了精细化量化、自动搜索策略和动态激活量化的方法,用于处理 Diffusion Transformer(DiT)模型中的权重和激活的巨大变化,以实现高效、高质量的量化和图像生成。