俄语和英语元音声音参数的比较

Jan, 2024

Comparison of parameters of vowel sounds of russian and english languages

V.I. Fedoseev, A.A. Konev, A. Yu. Yakimuk

TL;DR在多语种语音识别系统中，当语言事先未知但信号已接收并进行处理时，需要使用广义模型来对语音进行识别，根据语音差异来判断所需语言，为此需要设置语音参数值并比较相似声音以确定重要差异。

Abstract

In multilingual speech recognition systems, a situation can often arise when the language is not known in advance, but the signal has already been received and is being processed. For such cases, some generalized model is needed that will be able to respond to →

multilingual speech recognition systems phonetic differences speech processing phonetic parameters language identification

发现论文，激发创造

跨语言声学 - 语音相似度对多语种语音识别的影响研究

本文提出了一种新的数据驱动方法来研究跨语音识别方案中的跨语言声学语音相似性，通过训练深度神经网络来将来自不同声音模型的分布转化为可直接比较的形式，并通过熵分析发现少重叠语音的语言更易于跨语言传输，在融合单语言模型方面取得了相对于单语言识别的 8％的改进。

Jul, 2022

多语言异音字系统的通用手机识别

本研究中，通过建立联合模型来处理语言独立性的音位和语言相关性的音素的分布，改进了语音识别性能，同时可以建立一种 (几乎) 通用的音位识别器，当与 PHOIBLE 大型手动编辑的音位库相结合时，可定制为 2,000 个语言相关的识别器，此识别器可在低资源状况下实现语音识别。

Feb, 2020

使用感知同化模型和最先进的声学模型预测非母语言音知觉

本文通过利用两个先进的语音模型 (Dirichlet process Gaussian mixture model 和 wav2vec 2.0) 的表现来实现一种新的想法，探讨母语对语音感知的影响，以 61 个元音为例，并表明音位同化比精细的语音建模更好地预测区分行为，同时显示 wav2vec 2.0 是较低层次音韵特征的良好模型。

May, 2022

大规模多语种对抗性语音识别

本文介绍了对多达 100 种语言进行训练的多语言端到端语音识别模型的适应性，研究表明了目标语言和预训练语言在语音学、语音学、语言家族、地理位置和正字法等方面的相对重要性，并通过上下文无关的音素目标和语言对抗性分类目标提高了语言无关的编码器表示的效果。

Apr, 2019

基于语音合成网络的外语发音学习

通过在英语和韩语中训练语音合成网络，本研究分析了网络如何学习不同语言之间的拼音发音关系，并提出了一个基于不同语言信息的训练框架，可以应用于低资源语言。结果表明，该框架可扩展到其他语言，并成功地合成了英语和韩语之间的语音。

Nov, 2018

探究自动语音识别系统对 L2 英语语音变异的敏感性

使用一种探测方法，发现了 ASR 系统处理在 L2 英语方言中的发音差异时，出现了声素级别的错误并产生了更高的 WER。这项工作系统地说明了 ASR 的行为，通过确定特定问题的物质来源来提高 ASR 的准确性。

May, 2023

非母语口语词语处理的音韵模型

研究发现，非母语人士在处理口语时存在困难，导致其在词汇记忆的语音编码上不够准确，本研究使用计算模型模拟语音学习，发现有些非母语人士的口音知觉可能是导致这种困难的原因之一。

Jan, 2021

基于多语言上下文的语音合成中文字发学习

该研究提出了一个多语种统一的前端系统，通过建模语音信息和语言知识，在处理发音相关任务时取得了有竞争力的结果。

Jul, 2023

跨口音语音识别上的快速适应学习

研究了方言对同一语言单词发音的影响，提出了一种基于模型对抗元学习算法的跨方言英语语音识别任务，通过实验表明该方法显著优于联合训练。

Mar, 2020

适用于低资源语音识别的语言通用语音编码器

使用国际音标为基础的语言通用的语音模型在多语言音频识别中表现出良好效果，且通过自适应方法在极低资源语言的情况下改进了识别性能。

May, 2023