俄语和英语元音声音参数的比较
本文提出了一种新的数据驱动方法来研究跨语音识别方案中的跨语言声学语音相似性,通过训练深度神经网络来将来自不同声音模型的分布转化为可直接比较的形式,并通过熵分析发现少重叠语音的语言更易于跨语言传输,在融合单语言模型方面取得了相对于单语言识别的 8%的改进。
Jul, 2022
本研究中,通过建立联合模型来处理语言独立性的音位和语言相关性的音素的分布,改进了语音识别性能,同时可以建立一种 (几乎) 通用的音位识别器,当与 PHOIBLE 大型手动编辑的音位库相结合时,可定制为 2,000 个语言相关的识别器,此识别器可在低资源状况下实现语音识别。
Feb, 2020
本文通过利用两个先进的语音模型 (Dirichlet process Gaussian mixture model 和 wav2vec 2.0) 的表现来实现一种新的想法,探讨母语对语音感知的影响,以 61 个元音为例,并表明音位同化比精细的语音建模更好地预测区分行为,同时显示 wav2vec 2.0 是较低层次音韵特征的良好模型。
May, 2022
本文介绍了对多达 100 种语言进行训练的多语言端到端语音识别模型的适应性,研究表明了目标语言和预训练语言在语音学、语音学、语言家族、地理位置和正字法等方面的相对重要性,并通过上下文无关的音素目标和语言对抗性分类目标提高了语言无关的编码器表示的效果。
Apr, 2019
通过在英语和韩语中训练语音合成网络,本研究分析了网络如何学习不同语言之间的拼音发音关系,并提出了一个基于不同语言信息的训练框架,可以应用于低资源语言。结果表明,该框架可扩展到其他语言,并成功地合成了英语和韩语之间的语音。
Nov, 2018
使用一种探测方法,发现了 ASR 系统处理在 L2 英语方言中的发音差异时,出现了声素级别的错误并产生了更高的 WER。这项工作系统地说明了 ASR 的行为,通过确定特定问题的物质来源来提高 ASR 的准确性。
May, 2023
研究发现,非母语人士在处理口语时存在困难,导致其在词汇记忆的语音编码上不够准确,本研究使用计算模型模拟语音学习,发现有些非母语人士的口音知觉可能是导致这种困难的原因之一。
Jan, 2021