从形式和意义预测降维词类
本文提出了一种基于上下文化词向量探索词类灵活性的方法,并应用于 37 种语言,发现由于一定的上下文语境影响,单词在不同的语法类别中产生语义的位移现象,这支持了词类灵活性是一个具有方向性的过程的观点。
Sep, 2020
研究了英语名词复数和单数的语义,比较了基于 FRACSS 和 CCA 这两种概念化复数的模型,并在大语料上验证了语音信息和语意向量的预测关系,结果表明基于语用的语意表示方法的效果更好。
Jul, 2022
使用分布语义学,本文研究了英语名词复数形式的意义聚类,介绍了一种计算方法叫做 CosClassAvg,通过实验比较它与另一种方法 FRACSS 的差异,并验证了 CosClassAvg 方法在语义向量映射中的优越性
Mar, 2022
语义对于语言中的性别确定有多大影响是现代语言学和认知科学中一个研究热点领域。本研究提出了一个新的因果图模型,共同表示名词的语法性别、意义和形容词选择之间的相互作用。研究结果表明,虽然名词的性别会影响修饰它们的形容词,但在控制名词的意义后,语法性别对形容词选择几乎没有影响,从而质疑了新沃尔夫假说。
Nov, 2023
本文通过实证研究,考察了在六种不同的语言上,使用不同的形态学特征开发上下文词形还原器对下游表现的影响,并发现:(i)为词形还原器提供细粒度的形态学特征在训练时并不那么有益,即使对于词汇连接语言;(ii)实际上,现代上下文词表示似乎隐式地编码了足够的形态信息,以获得无需查看任何明确形态信号的良好上下文词形还原器;(iii)最佳的领域外词形还原器是使用简单的 UPOS 标签或者没有训练形态学的模型;(iv)目前的词形还原评估实践并不足以清晰地区分模型之间的差异。
Feb, 2023
本研究探讨符号学中的语言符号与其语义之间的关系,使用互信息和循环神经网络量化了符号的系统性,并在 106 种语言中进行了数据驱动和大规模的研究,结果表明,在表征有语义的单词形式时,熵有显著的降低,但是系统性和任意性间存在平衡关系。
Jun, 2019
本文通过提出一种基于句子层面的形态学,并创建了一个新的、基于句子层面的多语言数据集 MightyMorph,得出基于句子层面的变形、重新变形和分析任务比基于单词水平的任务更具挑战性,同时提供一种方便的界面与语境化语言模型(LMs)相接,评估这些模型中编码的形态学知识和它们用于形态学任务的可用性,为跨语言神经形态的研究打开了新的视野。
Feb, 2022