BriefGPT.xyz
Ask
alpha
关键词
attention decoder
搜索结果 - 2
将解码与知识蒸馏并行进行:从语言模型到端到端语音识别的有效知识蒸馏
通过使用中间层和最终层,本研究提出了一种将 BERT 教师模型的知识蒸馏到自动语音识别模型中的新方法。实验证明,使用中间层作为蒸馏目标可以更有效地将语言模型知识蒸馏到较低的网络层,从而实现比外部语言模型的浅层融合更好的识别准确性,同时保持了
→
PDF
5 months ago
将连接时序汇总添加到 Conformer 中,以提高其解码效率,用于语音识别
本研究提出了一种新的” 连接时序总结 “(CTS) 方法,它可以减少 Conformer 模型中 attention decoder 所需的 frames 数,提高解码效率,并且它能够在不损失 ASR 准确性的情况下降低解码预算,提高识别准
→
PDF
2 years ago
Prev
Next