新加坡儿童英语发音的大规模声学表征
本研究通过自动语音识别技术,对具有五种不同语言背景(汉语、越南语、日语、泰语和英语)的 L2 韩语学习者的发音误差模式进行了大规模分析,还使用了一种名为 Wav2Vec2 XLS-R 的发音识别系统进行深入分析,揭示了几种常见的错误模式并确认了其与某些语言背景有关。
Jun, 2023
本文从语音识别和语音合成的角度出发,对印度英语的发音变异进行了分析和研究,提出了一种基于数据驱动的新型语音转换模型,并用基于音素错误率的性能指标进行了测试。
Apr, 2022
研究印度英语说话者的口音,包括其母语语音的影响,并系统性地描述了印度英语的特点,以便于在自动语音识别和语音合成系统中实现印度口音的转换和适应。
Dec, 2022
本文分析了来自英语、韩语和泰米尔语三种具有不同韵律系统的语言的语音障碍者讲话数据集,检查反映语音质量、发音和韵律三个讲话维度的 39 个声学测量标准,提出在了解说话的可懂水平的平均声学测量值的基础上进行多语种分析,并进行自动可懂性分类以研究最佳功能集。分析表明发音特征是语言无关的测量标准,如音素正确百分比、辅音正确百分比和元音正确百分比,而声音质量和韵律特征通常呈现不同的语言特征。实验结果进一步表明,不同的语音维度在不同的语言中发挥更大的作用:英语的韵律,韩语的发音,泰米尔语的韵律和发音。这篇论文为语音病理学做出了贡献,因为它区分了英语、韩语和泰米尔语的语音障碍者可懂性分类中语言无关和语言相关的测量标准。
Sep, 2022
本文介绍了一个专门针对韩国自闭症儿童开发的语音语料库,旨在推进发音和严重程度评估等语音技术。通过对自闭症儿童的语音和语言评估会话录音进行转录和注释,提取语音数据并分析语音和语言特征,揭示了自闭症儿童的一些与典型发育儿童或通过临床评分分类的自闭症亚组有所不同的语音和语言特征,为社交沟通严重程度和发音熟练度的自动评估系统的开发提供了潜力。
Feb, 2024
本研究介绍了一个由 50 名中英双语 5-6 岁儿童故事叙述构成的非母语英语语音语料库,提供了 6.5 个小时的儿童在英语(L2)故事理解测试中的文本、语法和发音错误的标注记录和人工评级分数。本语料库可用于第二语言教学,并有助于提高自动语音识别(ASR)的总体性能。
Apr, 2023
该研究通过对收集自印度尼西亚,马来西亚,新加坡,菲律宾和文莱的中文新闻文本进行词汇和句法方面的量化分析,发现这些地区所使用的汉语存在较多的差异性,并提取和分类了每个国家使用的中文单词,这反映了汉语在海外的演变和本地文化对汉语发展的深刻影响。
Sep, 2022
本文利用机器学习模型探索什么因素会使一种语言的发音难度加大,并通过跨越 22 种不同语言的字符级变换器模型训练和验证,发现语言的发音难度主要由其字音对音素的映射的复杂性而非其文字本身的复杂性决定,并提出未来的研究应该考虑数据稀少性,以设计更公正的跨语言比较任务。
Jan, 2022
用逆相关方法系统地改变英语(/i/-/I/)和法语(/u/-/y/)的第二语言(L2)说话者语速和音高,从而重建偏向他们感知的韵律特征,发现元音感知实际上受到来自周围音高和语速的相冲突效应的影响,且 L1 和 L2 说话者在感知上表现出惊人的相似韵律特征。为研究跨刺激、时间尺度和声学领域的声学背景效应提供了一种新方法。
Jun, 2024
本文通过利用两个先进的语音模型 (Dirichlet process Gaussian mixture model 和 wav2vec 2.0) 的表现来实现一种新的想法,探讨母语对语音感知的影响,以 61 个元音为例,并表明音位同化比精细的语音建模更好地预测区分行为,同时显示 wav2vec 2.0 是较低层次音韵特征的良好模型。
May, 2022