考虑语言迁移效应的外来词普通话语音识别发音建模

Oct, 2022

考虑语言迁移效应的外来词普通话语音识别发音建模

Pronunciation Modeling of Foreign Words for Mandarin ASR by Considering the Effect of Language Transfer

Lei Wang, Rong Tong

TL;DR研究了语言转移对语音识别中自动识别外来词的影响，提出了一套将英语单词转换为汉语拼音的词汇规则，从而实现了增强语音识别词汇表的功能，最终提高了汉英混合语音的 ASR 性能。

Abstract

One of the challenges in automatic speech recognition is foreign words recognition. It is observed that a speaker's pronunciation of a foreign word is influenced by his native language knowledge, and such phenomenon is known as the effect of →

automatic speech recognition foreign words recognition language transfer lexicon phonetic effect

发现论文，激发创造

探究自动语音识别系统对 L2 英语语音变异的敏感性

使用一种探测方法，发现了 ASR 系统处理在 L2 英语方言中的发音差异时，出现了声素级别的错误并产生了更高的 WER。这项工作系统地说明了 ASR 的行为，通过确定特定问题的物质来源来提高 ASR 的准确性。

May, 2023

跨口音语音识别上的快速适应学习

研究了方言对同一语言单词发音的影响，提出了一种基于模型对抗元学习算法的跨方言英语语音识别任务，通过实验表明该方法显著优于联合训练。

Mar, 2020

自动语音识别多语言模型综述

该论文研究了基于跨语言转移的多语种自动语音识别模型的最新进展和最佳实践，并探讨了未来的研究方向和建议。

Feb, 2022

利用母语信息提高口音识别能力

本研究提出一种基于使用原生语言（西班牙语和印度语）预训练的端到端循环神经网络多任务学习模型，成功实现对英语口音的识别，相比于其他训练方法，此方法在减小语音中字符错误率方面表现更加优异。

Apr, 2019

跨语言声学 - 语音相似度对多语种语音识别的影响研究

本文提出了一种新的数据驱动方法来研究跨语音识别方案中的跨语言声学语音相似性，通过训练深度神经网络来将来自不同声音模型的分布转化为可直接比较的形式，并通过熵分析发现少重叠语音的语言更易于跨语言传输，在融合单语言模型方面取得了相对于单语言识别的 8％的改进。

Jul, 2022

重音语音识别综述

该研究论文探讨了自动语音识别（ASR）系统在不同语音口音上的普适性问题，分析了当前最有前景的口音识别方法，并强调了其中的关键挑战。

Apr, 2021

年轻英语学习者语音的错误保留自动语音识别

在这项工作中，我们构建了一个满足条件的自动语音识别系统，用于年轻语言学习者的自由说话并保留他们的错误。

Jun, 2024

使用单一端到端模型的多语言语音识别

本文介绍了一种基于序列到序列的正常语音识别模型，它适用于 9 种不同的印度语言，并通过训练语言特定的字形集合，将这些语言联合起来训练模型以提高其性能。

Nov, 2017

利用动态错误缩放机制提升中文自动语音识别纠错能力

利用动态错误放大机制来检测和纠正自动语音识别输出中的语音错误，通过动态融合单词级特征和语音信息，丰富模型的句义数据，并实施唯一的错误减少和放大策略，以解决因错误字符导致匹配错误单词的问题，实验结果表明在 ASR 错误修正方面取得了重大改进，证明了我们提出方法的有效性，并在已建立的数据集中取得了有希望的结果。

Aug, 2023

从英语到更多语言：参数高效的模型重编程用于跨语言语音识别

使用神经模型重编程的参数高效学习框架，可在跨语音识别中重新利用训练良好的英文自动语音识别模型，实现大规模预训练 ASR 成功，提高了训练效率。

Jan, 2023