Sep, 2023

加强量化的端到端 ASR 模型通过个性化

TL;DR使用 4-bit 正态浮点数量化和低秩自适应方法相结合的个性化量化模型策略,大幅降低了模型大小并显著减少了词错误率。