非母语口语词语处理的音韵模型

ACLJan, 2021

A phonetic model of non-native spoken word processing

Yevgen Matusevych, Herman Kamper, Thomas Schatz, Naomi H. Feldman, Sharon Goldwater

TL;DR研究发现，非母语人士在处理口语时存在困难，导致其在词汇记忆的语音编码上不够准确，本研究使用计算模型模拟语音学习，发现有些非母语人士的口音知觉可能是导致这种困难的原因之一。

Abstract

non-native speakers show difficulties with spoken word processing. Many studies attribute these difficulties to imprecise phonological encoding of words in the →

non-native speakers phonetic perception spoken word processing phonology lexical memory

发现论文，激发创造

使用感知同化模型和最先进的声学模型预测非母语言音知觉

本文通过利用两个先进的语音模型 (Dirichlet process Gaussian mixture model 和 wav2vec 2.0) 的表现来实现一种新的想法，探讨母语对语音感知的影响，以 61 个元音为例，并表明音位同化比精细的语音建模更好地预测区分行为，同时显示 wav2vec 2.0 是较低层次音韵特征的良好模型。

May, 2022

神经语音识别模型对音位同化的感知

本研究探讨了神经语音识别模型 Wav2Vec2 如何感知同化声音，并确定模型实现同化补偿的语言知识。通过心理语言学刺激和分析，我们发现不同的语言环境线索如何影响模型输出的补偿模式。我们的实验结果表明，模型在最后的层次将同化的声音从声学形式转变为其基本形式。此外，我们的因果干预实验表明，模型依赖最少的语音环境线索来实现这种转变。这些发现为更好地理解神经自动语音识别模型和人类之间的语音处理相似性和差异性迈出了一步。

Jun, 2024

学前儿童语言发展测试中的伪词发音分类

本研究旨在通过使用不同方法进行语音分析，包括低级特征、说话者嵌入、音素和 ASR 音频模型，使用 VGG - 类 5 层 CNN 分类器，以便自动评估儿童的语言发展是否年龄适宜，证明如果精细调节音素模型，精度可以获得显著提高，并且 ASR 伴音模型提取的语音特征在此任务中表现最佳。

Jun, 2022

学习发音作为跨语言联合正字音位复杂性的测量

本文利用机器学习模型探索什么因素会使一种语言的发音难度加大，并通过跨越 22 种不同语言的字符级变换器模型训练和验证，发现语言的发音难度主要由其字音对音素的映射的复杂性而非其文字本身的复杂性决定，并提出未来的研究应该考虑数据稀少性，以设计更公正的跨语言比较任务。

Jan, 2022

一个预测性学习模型可以模拟连续语音的神经表示中发现的时间动力学和上下文效应

模拟了从计算模型中提取的表示进行的分析揭示了与大脑信号相似的时间动态，这表明这些特性可以在没有语言知识的情况下出现。此外，研究证明，声素的编码模式支持一定程度的跨语境概括，但我们发现这种概括的有效性取决于具体的语境，这表明单独的分析不足以支持存在语境无关编码。

May, 2024

基于循环神经网络的语音表征建模中声音学编码

研究使用回归神经网络模型处理图像和其口述描述中语音音素的表示和编码，通过一系列实验分析了音素如何在模型的各层中编码，发现最明显的音素表示在较低层，而注意力机制则显著削弱语音学编码，并使得话语嵌入更加不变。

Jun, 2017

母语同源词对第二语言词汇选择的影响

通过大量非母语英语使用者的语料库，研究发现词汇选择受到个人母语的影响，特别是语序和词汇语境，甚至从单个例子出发可以重构印欧语系的语言家族树。

May, 2018

自监督语音模型探测音素和音位信息：以送气现象为案例研究

本文评估了自我监督语音模型的学习表示与人类语音的差异，结果表明这些模型在语音数据的优化和高维架构的帮助下成功地捕捉了语音的基本音素和音位特征，尤其是 speech-trained HuBERT 模型实现了抽象音位差异的低噪声和低维子空间。

Jun, 2023

母语设计偏见：研究英语作为母语对语言模型性能的影响

该研究通过分析数据集，探讨了大型语言模型在回答非英语母语使用者的问题时是否会产生性能偏差，结果发现与母语使用者相比，非英语母语使用者在与语言模型的互动中会获得更低质量甚至事实错误的回答。

Jun, 2024

基于记忆的词汇获取与处理

提出了一种基于自动内存学习语言（词汇）任务的自然语言处理的性能导向方法，讨论了其对计算词汇学的影响，并描述了该方法在音韵学、形态学和句法中对许多词汇获取和消歧任务的应用。

May, 1994