从形式和意义预测降维词类

ACLMay, 2020

Predicting Declension Class from Form and Meaning

Adina Williams, Tiago Pimentel, Arya D. McCarthy, Hagen Blix, Eleanor Chodroff...

TL;DR本研究研究了自然语言的名词语法变化，发现形式和语义对名词分类至关重要，尤其是在捷克语和德语中，能够为名词的语法变化提供很大的信息量，并且在不同语言中这种变化的差异性也存在。

Abstract

The noun lexica of many natural languages are divided into several declension classes with characteristic morphological properties. Class membership is far from deterministic, but the phonological →

noun lexica declension class form meaning

发现论文，激发创造

词类灵活性：一种深度上下文化的方法

本文提出了一种基于上下文化词向量探索词类灵活性的方法，并应用于 37 种语言，发现由于一定的上下文语境影响，单词在不同的语法类别中产生语义的位移现象，这支持了词类灵活性是一个具有方向性的过程的观点。

Sep, 2020

理解口语复数

研究了英语名词复数和单数的语义，比较了基于 FRACSS 和 CCA 这两种概念化复数的模型，并在大语料上验证了语音信息和语意向量的预测关系，结果表明基于语用的语意表示方法的效果更好。

Jul, 2022

英语名词复数的语义属性：来自词向量的启示

使用分布语义学，本文研究了英语名词复数形式的意义聚类，介绍了一种计算方法叫做 CosClassAvg，通过实验比较它与另一种方法 FRACSS 的差异，并验证了 CosClassAvg 方法在语义向量映射中的优越性

Mar, 2022

语法性别对分布语义的影响：因果视角

语义对于语言中的性别确定有多大影响是现代语言学和认知科学中一个研究热点领域。本研究提出了一个新的因果图模型，共同表示名词的语法性别、意义和形容词选择之间的相互作用。研究结果表明，虽然名词的性别会影响修饰它们的形容词，但在控制名词的意义后，语法性别对形容词选择几乎没有影响，从而质疑了新沃尔夫假说。

Nov, 2023

关于词形信息在上下文词形还原中的作用

本文通过实证研究，考察了在六种不同的语言上，使用不同的形态学特征开发上下文词形还原器对下游表现的影响，并发现：（i）为词形还原器提供细粒度的形态学特征在训练时并不那么有益，即使对于词汇连接语言；（ii）实际上，现代上下文词表示似乎隐式地编码了足够的形态信息，以获得无需查看任何明确形态信号的良好上下文词形还原器；（iii）最佳的领域外词形还原器是使用简单的 UPOS 标签或者没有训练形态学的模型；（iv）目前的词形还原评估实践并不足以清晰地区分模型之间的差异。

Feb, 2023

词汇表的（非）最佳性如何？

本文提出了一种基于编码理论的词库可压缩性的分析方法，并通过研究各种语言的语料库，发现了构成型形态学和书写规则可以充分解释自然编码的大部分复杂性。

Apr, 2021

量化性别系统的语义核心

本论文对生物语言的词性存在性别差异的现象进行了大规模探究，发现有 18 种语言的生物语言词性与词汇语义存在显著相关性，即生物语言的性别标记并非毫无规律可循。

Oct, 2019

从含义到形式：将系统性视为信息的衡量方式

本研究探讨符号学中的语言符号与其语义之间的关系，使用互信息和循环神经网络量化了符号的系统性，并在 106 种语言中进行了数据驱动和大规模的研究，结果表明，在表征有语义的单词形式时，熵有显著的降低，但是系统性和任意性间存在平衡关系。

Jun, 2019

形态变化的语境化

本文介绍了一种利用神经混合图模型构建并预测词形变化的方法，并将其与传统的形态学变化或表面实现进行了比较，证明了将语言学驱动的潜在变量纳入 NLP 模型的实用性。

May, 2019

无国界的形态学：从子句层面考虑

本文通过提出一种基于句子层面的形态学，并创建了一个新的、基于句子层面的多语言数据集 MightyMorph，得出基于句子层面的变形、重新变形和分析任务比基于单词水平的任务更具挑战性，同时提供一种方便的界面与语境化语言模型（LMs）相接，评估这些模型中编码的形态学知识和它们用于形态学任务的可用性，为跨语言神经形态的研究打开了新的视野。

Feb, 2022