Oct, 2022
考虑语言迁移效应的外来词普通话语音识别发音建模
Pronunciation Modeling of Foreign Words for Mandarin ASR by Considering the Effect of Language Transfer
Lei Wang, Rong Tong
TL;DR研究了语言转移对语音识别中自动识别外来词的影响,提出了一套将英语单词转换为汉语拼音的词汇规则,从而实现了增强语音识别词汇表的功能,最终提高了汉英混合语音的 ASR 性能。
Abstract
One of the challenges in automatic speech recognition is foreign words
recognition. It is observed that a speaker's pronunciation of a foreign word is
influenced by his native language knowledge, and such phenomenon is known as
the effect of →
发现论文,激发创造
探究自动语音识别系统对 L2 英语语音变异的敏感性
使用一种探测方法,发现了 ASR 系统处理在 L2 英语方言中的发音差异时,出现了声素级别的错误并产生了更高的 WER。这项工作系统地说明了 ASR 的行为,通过确定特定问题的物质来源来提高 ASR 的准确性。
May, 2023
利用母语信息提高口音识别能力
本研究提出一种基于使用原生语言(西班牙语和印度语)预训练的端到端循环神经网络多任务学习模型,成功实现对英语口音的识别,相比于其他训练方法,此方法在减小语音中字符错误率方面表现更加优异。
Apr, 2019
跨语言声学 - 语音相似度对多语种语音识别的影响研究
本文提出了一种新的数据驱动方法来研究跨语音识别方案中的跨语言声学语音相似性,通过训练深度神经网络来将来自不同声音模型的分布转化为可直接比较的形式,并通过熵分析发现少重叠语音的语言更易于跨语言传输,在融合单语言模型方面取得了相对于单语言识别的 8%的改进。
Jul, 2022
使用单一端到端模型的多语言语音识别
本文介绍了一种基于序列到序列的正常语音识别模型,它适用于 9 种不同的印度语言,并通过训练语言特定的字形集合,将这些语言联合起来训练模型以提高其性能。
Nov, 2017
利用动态错误缩放机制提升中文自动语音识别纠错能力
利用动态错误放大机制来检测和纠正自动语音识别输出中的语音错误,通过动态融合单词级特征和语音信息,丰富模型的句义数据,并实施唯一的错误减少和放大策略,以解决因错误字符导致匹配错误单词的问题,实验结果表明在 ASR 错误修正方面取得了重大改进,证明了我们提出方法的有效性,并在已建立的数据集中取得了有希望的结果。
Aug, 2023
从英语到更多语言:参数高效的模型重编程用于跨语言语音识别
使用神经模型重编程的参数高效学习框架,可在跨语音识别中重新利用训练良好的英文自动语音识别模型,实现大规模预训练 ASR 成功,提高了训练效率。
Jan, 2023