使用永久词义编号动态映射 Wordnets
本文提出一种将不同语言的词汇网络进行链接的方法,可用于自然语言处理等知识性应用,能够在目标语言的候选词汇同义词集排名的前十位中为 60%的所有同义词集和 70%的名词同义词集检索出获胜的同义词集。
Jan, 2022
通过使用公开的 Wordnets、机器翻译和单语种双语字典,我们提出了一种方法来为资源丰富和资源贫乏的语言生成 Wordnet 同义词集,这些方法适用于至少存在一种从英文翻译到该语言的双语词典的任何语言,是自动构建完整 Wordnets 的第一步。
Aug, 2022
本文提出 SememeWSD Synonym(SWSDS)模型,通过使用 OpenHowNet 中的同义词集和词义消歧(WSD)来为多义词的每个意义指定不同的向量,验证结果表明与 Gensim 的 wmdistance 方法相比,SWSDS 模型提高了语义相似性的准确性。
Jun, 2022
该研究提出了一种基于句子嵌入语言模型的自动构建词网的方法,利用未标记的语料库构建了 FilWordNet,该方法在不需人为监督的情况下可以自动感知词义和同义词集。
Apr, 2022
提出两种不同的方法来压缩 Princeton WordNet 的词义词汇,以及基于预训练的 BERT 词向量建立的 WSD 系统,在不需要额外训练数据的情况下大幅减小了神经 WSD 模型的大小,并在所有 WSD 评估任务上显著优于现有技术水平。
May, 2019
本研究为提高南亚次大陆语言自然语言处理技术,发布了 18 种印第安语言 Wordnet 资源。这些资源是专家手工创建的,与普林斯顿 WordNet 连接。
Jan, 2022
本文提出了一种新方法解决词义消歧中受语料库覆盖率和效率限制的问题,利用 WordNet 中的知识以及 Synsets 之间的上下位关系来减少所需的不同词义标记的数量,从而在大多数 WSD 评估任务上实现最先进的结果,在不使用附加训练数据的情况下提高督导系统的覆盖范围、减少训练时间和模型的大小,此方法结合集成技术和 WordNet Gloss Tagged 作为训练语料时可以得到显着的超越当前最先进状态的结果。
Nov, 2018
本研究提出了一种单词意义的扩展范式,以启发式的方法解决了在语言处理中单词意义消岐的限制,展示了一种基于链式认知模型和语言模型嵌入空间的学习算法,该算法可以有效地扩展英语单词的新意义,同时提高了对训练数据中罕见单词通常使用的 WSD 模型的预测准确率。
Jun, 2023
本文提出了一种无监督的方法来区分名词的意义变化,并通过数字化书籍中的严格时间变化文本数据构建分布式词库网络,将它们分别聚类以获得与不同时间点对应的以词为中心的意义聚类,这种方法可应用于词汇编纂和语义搜索,并经过人工评估和 WordNet 对比,该算法在 48 个样本和 21 个样本分别中正确识别出 60.4%的新出现情况,57%的分裂 / 合并情况,并有 44%的新意义得到 WordNet 验证。
May, 2014