词频不预测语言模型的语法知识
本研究探讨预先训练的语言模型处理语言任务时是否具有一定程度的符号推理能力,并使用 BERT 模型的英语主语 - 谓语一致性表现为案例研究,发现 BERT 模型能够应用主语 - 谓语一致性规则进行推理,但受单词频率影响较大。
Sep, 2021
人们可以从很少的示例中学习一个新词并推断其语法属性。我们从心理语言学中得到启发,进行了一个名词学习实验,以评估 LSTM 和仅解码器的 Transformer 模型是否能够在法语中实现类似人类的语法性别抽象化。我们发现两种语言模型可以有效地从一个到两个学习示例中推广获得新的名词性别,并将所学的性别应用于协议上下文,尽管对于男性性别类别有一定偏倚。重要的是,几次性学习更新仅应用于嵌入层,表明模型在词嵌入空间内编码了足够的性别信息。虽然模型的泛化行为表明它们将语法性别表示为一个抽象的类别,类似于人类,但还需要进一步探索其具体实现细节。为了与人类行为进行比较,我们进行了一项类似的单次学习实验,揭示了如同语言模型一样,法语母语人士也表现出男性性别偏倚,而且也不能很好地进行单次学习。
Mar, 2024
该研究提出了使用一个语言模型预测的句子的语法正确性来评估该模型的数据集。实验结果表明,在众多句子变体中,LSTM 语言模型的准确性较差,而使用句法目标的多任务训练可以提高模型的准确性,但模型仍存在较大的进步空间。
Aug, 2018
研究了神经序列模型通过 typological properties 如词序和形态格标示来获取一种语言的语法的能力,针对这种种类繁多的语法特征和训练语料之间的复杂交互,作者使用了从英文中生成一些与英文在一个或多个语言学特性上不同的合成语言来避免影响,研究表明诸如 SVO 词序、多个格标示等特性可以有效提高合成语言的一致性效果。
Mar, 2019
通过因果中介分析方法研究预训练神经语言模型,揭示模型在困难情境下表现主语 - 谓语服务一致性的机制,研究发现模型的偏好程度及神经元对于主语 - 谓语一致性处理在语法结构不同的句子中存在相似性和差异性,同时表明了不同体系结构和规模的语言模型的相似性和差异性,以及主语 - 谓语一致性生成的两个不同机制。
Jun, 2021
通过多语言的句法评估套件 CLAMS,调查神经词语预测模型在各种语言中学习语法的能力,结果表明单语 LSTMs 在句子成分及吸引子存在时达到了很高的精度,而在其他方面的一致性准确率较低,多语言模型通常表现不如单语模型。
May, 2020
该研究评估了基于 Transformer 的神经语言模型在语法识别任务中的一般性能力,特别是在处理句子结构和词汇形态方面的通用表现,描述了在有吸引因素的情况下,词汇独立的句法泛化失败的情况。
Apr, 2022
通过使用模糊性相对子句附加来扩展语言模型在多重同时有效解释的情况下的评估方法。我们比较了英语和西班牙语模型的表现,以展示 RNN LMs 中的非语言偏见优势重叠在英语而非西班牙语的句法结构上。因此,英语模型可能具有类似于人类的句法偏好,而在西班牙语上训练的模型无法获得类似的人类句法偏好。
May, 2020