BriefGPT.xyz
大模型
Ask
alpha
关键词
acoustic encoder
搜索结果 - 4
利用编码解耦的有效混合专家方法进行代码切换语音识别
通过引入一种新的解缠损失函数,本研究专注于改进端到端自动语音识别(ASR)的声学编码器,以解决代码切换现象带来的挑战,并通过实验验证了该方法的优越性。
PDF
4 months ago
邻近标记合并加速传感器
该研究提出了一种名为 Adjacent Token Merging 的新方法,该方法通过逐步合并具有高相似性分数的相邻标记来减少令人烦恼的 ASR 系统的时间步长,并在 LibriSpeech 上的实验表明,该方法可以减少 57%的标记并提
→
PDF
a year ago
模块化混合自回归传感器
本文提出了一种模块化混合自回归转录器(MHAT),该转录器具有结构上分离的标签和空白解码器,涉及共享的声学编码器,因此在语音识别中具有方便的文本自适应性和内部语言模型。在大量实验中该方法的内部语言模型具有高效性,因此在 Google 大规模
→
PDF
2 years ago
高效地融合预训练的声学和语言编码器用于低资源语音识别
该论文研究了如何将预训练声学编码器和预训练语言编码器融合到端到端自动语音识别模型中,以提高模型的性能,尤其是在低资源自动语音识别的情境下。实验证明,该方法比其他端到端模型在 15 小时的 CALLHOME 语料库上表现得更好。
PDF
3 years ago
Prev
Next