非母语口语词语处理的音韵模型
本文通过利用两个先进的语音模型 (Dirichlet process Gaussian mixture model 和 wav2vec 2.0) 的表现来实现一种新的想法,探讨母语对语音感知的影响,以 61 个元音为例,并表明音位同化比精细的语音建模更好地预测区分行为,同时显示 wav2vec 2.0 是较低层次音韵特征的良好模型。
May, 2022
本研究探讨了神经语音识别模型 Wav2Vec2 如何感知同化声音,并确定模型实现同化补偿的语言知识。通过心理语言学刺激和分析,我们发现不同的语言环境线索如何影响模型输出的补偿模式。我们的实验结果表明,模型在最后的层次将同化的声音从声学形式转变为其基本形式。此外,我们的因果干预实验表明,模型依赖最少的语音环境线索来实现这种转变。这些发现为更好地理解神经自动语音识别模型和人类之间的语音处理相似性和差异性迈出了一步。
Jun, 2024
本研究旨在通过使用不同方法进行语音分析,包括低级特征、说话者嵌入、音素和 ASR 音频模型,使用 VGG - 类 5 层 CNN 分类器,以便自动评估儿童的语言发展是否年龄适宜,证明如果精细调节音素模型,精度可以获得显著提高,并且 ASR 伴音模型提取的语音特征在此任务中表现最佳。
Jun, 2022
本文利用机器学习模型探索什么因素会使一种语言的发音难度加大,并通过跨越 22 种不同语言的字符级变换器模型训练和验证,发现语言的发音难度主要由其字音对音素的映射的复杂性而非其文字本身的复杂性决定,并提出未来的研究应该考虑数据稀少性,以设计更公正的跨语言比较任务。
Jan, 2022
模拟了从计算模型中提取的表示进行的分析揭示了与大脑信号相似的时间动态,这表明这些特性可以在没有语言知识的情况下出现。此外,研究证明,声素的编码模式支持一定程度的跨语境概括,但我们发现这种概括的有效性取决于具体的语境,这表明单独的分析不足以支持存在语境无关编码。
May, 2024
研究使用回归神经网络模型处理图像和其口述描述中语音音素的表示和编码,通过一系列实验分析了音素如何在模型的各层中编码,发现最明显的音素表示在较低层,而注意力机制则显著削弱语音学编码,并使得话语嵌入更加不变。
Jun, 2017
本文评估了自我监督语音模型的学习表示与人类语音的差异,结果表明这些模型在语音数据的优化和高维架构的帮助下成功地捕捉了语音的基本音素和音位特征,尤其是 speech-trained HuBERT 模型实现了抽象音位差异的低噪声和低维子空间。
Jun, 2023
该研究通过分析数据集,探讨了大型语言模型在回答非英语母语使用者的问题时是否会产生性能偏差,结果发现与母语使用者相比,非英语母语使用者在与语言模型的互动中会获得更低质量甚至事实错误的回答。
Jun, 2024
提出了一种基于自动内存学习语言(词汇)任务的自然语言处理的性能导向方法,讨论了其对计算词汇学的影响,并描述了该方法在音韵学、形态学和句法中对许多词汇获取和消歧任务的应用。
May, 1994