Apr, 2024

TMPQ-DM: 高效扩散模型的时间步减少和量化精度选择

TL;DRTMPQ-DM 通过联合优化时间步长减少和量化以达到更高的性能和效率平衡,其中包括针对非均匀组合和精细层次分配位宽的设计组件,通过梯度 - free 进化搜索算法快速探索决策空间。