BriefGPT.xyz
大模型
Ask
alpha
关键词
wer improvement
搜索结果 - 3
增强本地性动态偏置和采样策略用于上下文自动语音识别
通过分析不同的采样策略和相关性图,本文首先对上下文偏置模块的训练进行了探究。其次,引入了邻居注意力机制来进一步优化上下文偏置的输出,实验结果表明相对于基准模型,在 LibriSpeech 数据集和稀有单词评估上平均相对词错误率提升了 25.
→
PDF
5 months ago
改进和分析用于 ASR 的神经说话人嵌入
本文研究了将神经说话者嵌入用于一个 ASR 系统,并通过基于 Conformer 的混合 HMM ASR 系统,在使用加权简单加法(Weighted-Simple-Add)集成方法时,展示了改进的嵌入提取流程,通过比较和分析不同的说话者嵌入
→
PDF
a year ago
CCC-wav2vec 2.0:利用聚类辅助的交叉对比自监督学习的语音表征学习
提出了一种名为 ccc-wav2vec 2.0 的新的自监督预训练策略,该方法使用聚类和基于数据增强的相交对比损失作为自监督目标,并取得了约 15.6% 和 12.7% 的 WER 相对改进,也可在 Switchboard 数据上获得最高
→
PDF
2 years ago
Prev
Next