BriefGPT.xyz
大模型
Ask
alpha
关键词
phoneme error rate
搜索结果 - 3
Recycle-and-Distill: 基于注意力映射重用和掩码蒸馏的 Transformer 语音 SSL 模型通用压缩策略
本研究提出基于 Transformer 的语音自监督学习模型压缩方法,包括重用注意力矩阵并采用新型蒸馏策略。我们的通用压缩策略可在 SUPERB 基准测试中实现 7.72% 的音素错误率和 9.96% 的单词错误率。
PDF
a year ago
EMNLP
高度多语言神经音素转写
本文提出了使用神经序列到序列模型进行语音转换的方法,这个方法可以用在多种语言上,并且相比于基于高资源单语言模型适应低资源语言的方法,我们的方法在语音识别上的表现有显著提升,同时我们的模型更加紧凑。
PDF
7 years ago
基于注意力机制的语音识别模型
本研究提出了一种基于改进的注意力机制加上位置感知的模型,解决了长输入音频识别中的问题并且有效降低了音素错误率。
PDF
9 years ago
Prev
Next