May, 2023

Whisper-KDQ:基于知识蒸馏和量化引导的轻量化口语识别技术

TL;DR本文介绍一种新的知识蒸馏和量化的方法,用于压缩预训练的语音识别模型 Whisper,保持其性能的同时减少模型大小和计算开销,实验结果表明该方法可以将原始模型压缩至 5.18X/10.48X,同时以字符误差率的 11.3%和 14.0%的相对减少量维持性能。