人类方言的空间演化
德语的语法特征在意大利东北部的罗曼语方言中的传播是一个案例研究,通过使用地理数据科学的工具产生交互式地图,表达了领土中使用德语语言特征的比例。使用一种描述二维扩散对流现象的函数,以及 Schmidt 的 “波浪” 作为扩散方程的解,可以再现真实语言扩散事件的复杂性。
Jul, 2023
本文分析了基于句法表示的方言分类器在空间和时间上的稳定程度,并构建了一个测试集,评估了 12 种英语方言在 3 年内随时间变化的分类准确性和语法变化速率。通过在语用建构语法范式(CxG)中制定的句法表示,可以识别在时间和空间上发生语法变化的地区。本文的主要贡献在于表明严格评估方言分类模型可用于发现空间上的变异和时间上的变化。
Sep, 2022
本文从实证及计算两方面主要探讨使用更多的语言类型学数据作为语言史前迁徙、语言之间深层系统关系及语言交互模式更准确研究和预测的可行性,重点解决了实证方法、计算模拟等方面的问题,并得出通过语言类型学数据能得出新的语言史前迁徙证据的结论。
Jul, 2006
通过对荷兰方言和闽方言的微观研究,我们在方言层面上发现了词长和音韵复杂性之间的权衡关系,并使用 LSTM 基于电话级别的语言模型得出实证证据。地理广义加性模型(GAM)表明,音韵复杂性较低的方言集中于首都地区,这与语言变体中人口较多或更多样化的陈述相对应。我们还尝试了将预测音节构成作为辅助任务纳入,但未观察到负相关性的增加。
Feb, 2024
通过探索与语言的亲缘关系、接触领域、普遍性或偶然性相关的词汇联合,本研究通过构建大规模图表,包含语义、亲缘、音系和地理数据,从而揭示了亲缘稳定性和接触引起的变化对跨语言相似性的语言学影响。该研究支持了语言学领域先前的一个假设,并提供了反证证据,为跨学科研究,例如多语言自然语言处理和比较语言学,提供了一个开放的研究资源。
Jan, 2024
人们的社会经济背景和他们使用标准语言形式相关联,在各种社会语言学研究中已有证明。然而,从定量的角度来看,不同社会经济阶层之间的混合可能会对这些相关性产生影响,而这方面的研究相对较少。本研究利用地理标记的推特和可转移的计算方法,在英格兰和威尔士的七千个行政区域上大规模地绘制非标准英语的偏离,与高分辨率的收入地图结合,为家庭位置用户分配一个代理社会经济指标。令人惊讶的是,在八个大都市区域,我们发现一个一致的模式,即不同社会经济阶层混合得越多,他们离标准语法的频率和收入的相互依赖性越小。此外,我们提出了一个基于代理人的语言多样性采纳模型,对产生数据中所观察到的现象提供了解释。
Jul, 2023
该研究使用基于代理人的模型,在社交媒体平台 Twitter 上收集的创新性单词数据集基础上,揭示了文化创新传播的地理模式取决于身份认同和网络拓扑结构的交互作用。网络贡献了弱关联扩散,而身份认同则对强联系扩散起着不同寻常的作用,两者结合才能更好的解释文化创新的传播。
Feb, 2022
采用 Twitter 数据,研究英语和西班牙语的语言统计学,特别是不同尺度的排名多样性以及 Twitter 专属标记的统计学,发现在语法尺度上,即使在不同的尺度、语言和国家值下,排名多样性曲线最相似。结论有助于量化语言统计特征的普遍性及其带来的变化。
Jul, 2022
该研究利用整个语法以及语法中的独立节点对方言之间的句法差异进行了系统建模,结果表明句法变异的重要部分是语法不同部分之间的相互作用,并且方言之间的相似性严重依赖于被观察的语法子集。
Sep, 2023