Sep, 2022

通过共享稀疏门控专家实现参数高效的共轭词器,用于端到端语音识别

TL;DR本文研究并提出了一种参数效率更高、适用于语音识别的 conformer 变种,采用了稀疏门控 Mixture-of-experts (MoE) 来扩展其容量并实现共享参数,同时使用知识蒸馏进一步提高性能。实验结果表明,该模型相较于全参数编码器,仅用 1/3 的参数即能达到竞争优势。