关于词形变化中不规则性的历时稳定性

ACLApr, 2018

关于词形变化中不规则性的历时稳定性

On the Diachronic Stability of Irregularity in Inflectional Morphology

Ryan Cotterell, Christo Kirov, Mans Hulden, Jason Eisner

TL;DR本文使用循环神经网络模拟语言学习者，定量研究了语言中不规则单词的存在条件，测试了单词频率与不规则性之间的历时关系。

Abstract

Many languages' inflectional morphological systems are replete with irregulars, i.e., words that do not seem to follow standard inflectional rules. In this work, we quantitatively investigate the conditions under which

inflectional morphology irregulars language change recurrent neural networks frequency

发现论文，激发创造

形态上的不规则与频率相关

本研究展示了一个对语言形态上不规则性的定义，并在 28 种语言中使用神经传导模型估计此数量，证明了不规则性与高频度之间的相关性，并且在单元语法的层面聚合时，相关性更为稳固。

Jun, 2019

关于词形变化系统的复杂性和类型学

我们量化不同语言形态系统的语言复杂度，揭示了屈折范式的大小和不规则程度之间的经验权衡，即一种语言的屈折范式可以是大小大，或高度不规则，但永远不会两者兼备。我们的方法体现了屈折范式的熵 - 即共同预测范式所有表面形式的难度。我们通过变分逼近估计这一问题，并测量这些范例在 31 种类型多样的语言中的表现。

Jul, 2018

形态变化：一次现实检验

研究分析了词形变化在子词 NLP 中的高性能和高可变性的原因，提出了更好反映实际使用情况的数据采样和评估策略，探讨了当前变形系统的泛化能力。

May, 2023

相關不代表補償：詞彙中的複雜性和不規則性

在语言中，形态上不规则的词往往具有音节结构简单的特点，而形态规则的词则往往具有音节结构复杂的特点。我们研究了这四个变量之间的关系，并发现形态上的不规则性和音节结构的复杂性之间存在着正向关系，尽管在不同的语言中方向有所不同。我们还发现了形态上的不规则性和词的长度之间存在着负向关系，并且某些关于这四个变量关系的现有发现并不像以前认为的那么可靠。

Jun, 2024

评估变换器神经网络作为英语过去时屈折的认知模型

本研究通过训练一组不同参数设置的 Transformer 模型，在英语动词过去式词形成任务上取得了高精度，进一步暗示了模型具有某种程度的抽象学习能力，但其表现不符合人类数据，可能不是一个好的认知模型。

Oct, 2022

形态学屈折的最小监督

该研究使用少量标记的数据引导标注词形变化，利用不同类型的规律，通过类比词标记和距离对词配对，证明了手工标记许多示例可能是不必要的。

Apr, 2021

不要忘记长尾词！双语词库归纳中形态学归纳的全面分析

本研究探讨双语词典学习是否有能力学习罕见的语法变形，并证明通过在训练时添加简单的形态学约束可以提高双语词典学习的性能。

Sep, 2019

Morph-fitting：用简单的特定语言规则微调词向量空间

提出了一种新颖的基于词形的约束方法，通过使用简单的语言特定规则来改进分布向量空间的语义质量，这种方法可以提高低频词估计的准确性，并在解决语言理解任务的长尾现象方面取得显著的效果。

Jun, 2017

低资源形态变化的极限探究

提出一种针对低资源语言的自动词形变化生成方案，在神经网络方法、注意力机制、跨语言转移学习等方面做了改进并实现了 15% 的性能提升。发现了语言类别相似和通用表示是跨语言转移学习成功的关键因素。

Aug, 2019

带音韵特征的形态变化

本研究探索了通过不同方式获取亚字符音韵特征对形态学模型、尤其是重音和分析的效果，通过语言特定的语法从标准文字数据中引出音素数据，并用两种重音模型在八种语言中进行实验。

Jun, 2023