该研究通过分析数据集,探讨了大型语言模型在回答非英语母语使用者的问题时是否会产生性能偏差,结果发现与母语使用者相比,非英语母语使用者在与语言模型的互动中会获得更低质量甚至事实错误的回答。
Jun, 2024
该研究提出了一种语言竞争模型,该模型充分考虑了记忆和学习对语言转移动态的影响,通过使用 Abrams-Strogatz 模型作为起点。模型以讲话者比例的阈值来表达记忆和学习的效应,在最简单的形式下,该模型是可解的。除了两种语言中的共识外,该模型还描述了 Abrams-Strogatz 模型中不存在的其他平衡状态:如果两个阈值都足够低,使得两个相反方向上的语言转移过程相互抵消,将出现两种语言的稳定共存;同时,当这两个阈值对于任何语言转移来说都太高时,将出现与初始状态相符的冻结状态。我们通过数值模拟证明了这些结果在阈值函数形状更一般的情况下仍然成立。
通过大量非母语英语使用者的语料库,研究发现词汇选择受到个人母语的影响,特别是语序和词汇语境,甚至从单个例子出发可以重构印欧语系的语言家族树。
May, 2018
本研究使用区分词典模型,提出了一种称为频率知情学习的方法,能够更加高效地模拟频率效应,以及探究了如何在认知模型中更好地解释低频词。
Jun, 2023
通过使用线性判别学习者以及多语义向量和多语言音类的多语言建模方法,该研究提供了一种计算方法来自动化测试语言之间的相互可理解性,并发现模型的理解准确性取决于词尾的自动修整和测试的语言对。
Feb, 2024
这项研究探讨了第二语言(L2)英语演讲模仿中 F0 演化的问题,在交替阅读任务(ART)中。结果表明,L2 英语熟练程度与演化之间存在微妙的关系:熟练程度较高的演讲者在音高变化和下降方面通常表现出较少的演化。然而,在一对一的情况下,熟练程度较高的演讲者表现出更强的模仿音高范围的能力,导致进一步的演化。这表明熟练程度在个体和对位级别上对演化产生不同的影响,突出了语言技能和韵律的复杂相互作用。
Apr, 2024
研究发现,非母语人士在处理口语时存在困难,导致其在词汇记忆的语音编码上不够准确,本研究使用计算模型模拟语音学习,发现有些非母语人士的口音知觉可能是导致这种困难的原因之一。
Jan, 2021
本文使用翻译文本开发了一种公平的跨语言语言模型比较方法,在 21 种语言中展示了复杂的屈折形态是导致不同语言性能差异的原因。
Jun, 2018
本文提出一种基于深度神经网络技术利用多语言预训练语言模型(如 BERT)中嵌入空间的词分布测量语言之间语义差异的解决方案,并通过实证考察验证了该方法对于解释各国英语能力在 TOEFL iBT 中一致变异的有效性,结果表明语言距离对国家的英语能力具有负面影响,在语言的生产方面如说和写的子技能方面影响更显著。另外,我们对未来的研究方向提出具体的建议。
Nov, 2022
本文通过利用两个先进的语音模型 (Dirichlet process Gaussian mixture model 和 wav2vec 2.0) 的表现来实现一种新的想法,探讨母语对语音感知的影响,以 61 个元音为例,并表明音位同化比精细的语音建模更好地预测区分行为,同时显示 wav2vec 2.0 是较低层次音韵特征的良好模型。
May, 2022