BriefGPT.xyz
大模型
Ask
alpha
关键词
non-streaming asr
搜索结果 - 2
MM
多解码器与知识蒸馏的流式与非流式自动语音识别的联合优化
本文通过使用多解码器和知识蒸馏来实现流式和非流式自动语音识别(ASR)的联合优化,主要研究了 ASR 模块的编码器整合、分离解码器以实现灵活切换模式,以及通过两个模块化编码器和解码器之间的相似性保持知识蒸馏来提高性能。评估结果显示,在单一模
→
PDF
a month ago
语音识别统一流式和非流式两遍端到端模型
本文提出了一种新颖的两步方法,用于将流式和非流式端到端(E2E)语音识别统一到单个模型中,该模型采用混合 CTC /attention 架构,在编码器的 conformer 层进行修改,并且在推理时,CTC 解码器以流式方式生成 n 个最佳
→
PDF
4 years ago
Prev
Next