儿童随时间学习的多义词
通过信息理论和深度学习,本研究考察了生物符号学中的选择过程,特别是儿童词汇学习偏见的弱化和 Zipf 词汇分布定律的影响因素。研究结果也为未来在生物符号学其它方面的实验研究提供了参考。
May, 2021
使用稀疏分布式表示来表达单词的多个意思,Category Builder 是一个工作系统,可以支持多方面的词汇表示和多重成员资格,对于诸如 “埃及的恒河” 或 “托尔金的伏地魔” 之类的类比问题表现出色。
May, 2018
本文通过在英语、荷兰语和西班牙语三种语言中,以音节长度和音素长度两种新的方式来测量单词的长度,证明了在所有语言中,单词频率与多义性和缩写的趋势存在相关性。
Mar, 2019
通过定量研究 Wordnet 数据库的语义网络结构,我们发现语义链接遵循自组织网络的幂率尺度不变行为,而多义词作为一个单词在语义网络中起到了联系不同含义的作用。包含多义链接会对语义图的组织产生深远的影响,形成了一个小世界,并呈现出高流量聚类(枢纽)代表抽象概念。因此,我们的结果表明,多义词组织具有紧凑和分类的表现形式,并可能解释多义词在各种语言中的普遍存在。
Jun, 2001
通过大规模预训练的人工神经网络对单词进行视觉和语言表示,研究了早期动词学习的三个假设,并比较了影响困难度的因素。结果表明,视觉结构变异性是影响动词学习的最大挑战。
Apr, 2023
本文提出了一种三倍增的方法来进行无监督的多义词建模,其中使用低秩子空间来表示包含目标单词的句子,通过对表示的格拉斯曼几何进行聚类算法对目标单词的不同义项进行消歧辨别,最后基于英文维基百科语料库得出了多个词和词义对的表示,这些算法在标准意义识别和消歧辨别数据集上带来了新的最佳成果。
Oct, 2016
通过本文,我们引入了概念归纳这个非监督任务,从数据中学习一组定义概念的词语软聚类,该任务概括了词义归纳的任务。我们提出了一种双层方法来进行概念归纳,充分利用了本地词元为中心和全局跨词库视角来引导概念的生成。我们在 SemCor 的注释数据上评估所得到的聚类,并获得了良好的性能(BCubed F1 大于 0.60)。我们发现在我们的设置中,本地和全局层次相互有益于概念和词义的生成。最后,我们创建了表示我们引入的概念的静态嵌入,并在上下文任务中使用它们,取得了与现有技术相媲美的性能。
Jun, 2024
使用分布语义学,本文研究了英语名词复数形式的意义聚类,介绍了一种计算方法叫做 CosClassAvg,通过实验比较它与另一种方法 FRACSS 的差异,并验证了 CosClassAvg 方法在语义向量映射中的优越性
Mar, 2022
本文研究了语境化语言模型的多义词辨别能力。作者提出了一个人工注释的数据集,用于评估多义词词义的相似性,发现多义词的词义相似性介于相同和同音异义之间,并呈现出一定的词义变化规律性。BERT Large 在相似性等级方面表现最佳,但无法一致地复制观察到的相似性模式,并且在某些类型的多义词变化上存在问题。
Sep, 2021
我们的研究使用最新的上下文语言模型对词汇歧义的心理学理解进行了一系列模拟,发现它们捕捉了单义词、同音异义词和多义词之间的微妙有意义的区别,为现代心理学理解词汇歧义提供了量化支持,并提出了理解上下文信息如何跨不同时间尺度塑造词汇意义的新挑战。
Apr, 2023