使用永久词义编号动态映射 Wordnets

Mar, 2023

使用永久词义编号动态映射 Wordnets

Mapping Wordnets on the Fly with Permanent Sense Keys

Eric Kafe

TL;DR提出一种在线算法，可以在加载时将旧版 WordNet 链接更新为较新的英文 WordNet 版本，并自动推导其中词义的映射关系，从而解决其版本不兼容的问题。

Abstract

Most of the major databases on the semantic web have links to Princeton WordNet (PWN) synonym set (synset) identifiers, which differ for each PWN release, and are thus incompatible between versions. On the other hand, both PWN and the more recent →

semantic web princeton wordnet open english wordnet algorithm interoperability

发现论文，激发创造

使用词向量进行半自动 WordNet 关联

本文提出一种将不同语言的词汇网络进行链接的方法，可用于自然语言处理等知识性应用，能够在目标语言的候选词汇同义词集排名的前十位中为 60％的所有同义词集和 70％的名词同义词集检索出获胜的同义词集。

Jan, 2022

自动构建 Wordnet 同义词集

通过使用公开的 Wordnets、机器翻译和单语种双语字典，我们提出了一种方法来为资源丰富和资源贫乏的语言生成 Wordnet 同义词集，这些方法适用于至少存在一种从英文翻译到该语言的双语词典的任何语言，是自动构建完整 Wordnets 的第一步。

Aug, 2022

使用 SememeWSD 和同义词集进行中文词义嵌入

本文提出 SememeWSD Synonym（SWSDS）模型，通过使用 OpenHowNet 中的同义词集和词义消歧（WSD）来为多义词的每个意义指定不同的向量，验证结果表明与 Gensim 的 wmdistance 方法相比，SWSDS 模型提高了语义相似性的准确性。

Jun, 2022

英语 WordNet 的同音词信息

本文重新访问了填补 WordNet 中同音异义词及多义词间差异的问题，并且利用语言模型对此进行了合成标注。

Dec, 2022

利用句子嵌入进行词义归纳自动构建 WordNet

该研究提出了一种基于句子嵌入语言模型的自动构建词网的方法，利用未标记的语料库构建了 FilWordNet，该方法在不需人为监督的情况下可以自动感知词义和同义词集。

Apr, 2022

利用 WordNet 的语义知识提高神经词义消歧中的语义词汇压缩

提出两种不同的方法来压缩 Princeton WordNet 的词义词汇，以及基于预训练的 BERT 词向量建立的 WSD 系统，在不需要额外训练数据的情况下大幅减小了神经 WSD 模型的大小，并在所有 WSD 评估任务上显著优于现有技术水平。

May, 2019

印度语言 Wordnet 及其与普林斯顿 WordNet 的链接

本研究为提高南亚次大陆语言自然语言处理技术，发布了 18 种印第安语言 Wordnet 资源。这些资源是专家手工创建的，与普林斯顿 WordNet 连接。

Jan, 2022

通过上下位关系提高神经词义消歧的覆盖率和泛化能力

本文提出了一种新方法解决词义消歧中受语料库覆盖率和效率限制的问题，利用 WordNet 中的知识以及 Synsets 之间的上下位关系来减少所需的不同词义标记的数量，从而在大多数 WSD 评估任务上实现最先进的结果，在不使用附加训练数据的情况下提高督导系统的覆盖范围、减少训练时间和模型的大小，此方法结合集成技术和 WordNet Gloss Tagged 作为训练语料时可以得到显着的超越当前最先进状态的结果。

Nov, 2018

词义拓展

本研究提出了一种单词意义的扩展范式，以启发式的方法解决了在语言处理中单词意义消岐的限制，展示了一种基于链式认知模型和语言模型嵌入空间的学习算法，该算法可以有效地扩展英语单词的新意义，同时提高了对训练数据中罕见单词通常使用的 WSD 模型的预测准确率。

Jun, 2023

不同时间尺度下单词意义变化的自动识别

本文提出了一种无监督的方法来区分名词的意义变化，并通过数字化书籍中的严格时间变化文本数据构建分布式词库网络，将它们分别聚类以获得与不同时间点对应的以词为中心的意义聚类，这种方法可应用于词汇编纂和语义搜索，并经过人工评估和 WordNet 对比，该算法在 48 个样本和 21 个样本分别中正确识别出 60.4％的新出现情况，57％的分裂 / 合并情况，并有 44％的新意义得到 WordNet 验证。

May, 2014