自动构建 Wordnet 同义词集

Aug, 2022

Automatically constructing Wordnet synsets

Khang Nhut Lam, Feras Al Tarouti, Jugal Kalita

TL;DR通过使用公开的 Wordnets、机器翻译和单语种双语字典，我们提出了一种方法来为资源丰富和资源贫乏的语言生成 Wordnet 同义词集，这些方法适用于至少存在一种从英文翻译到该语言的双语词典的任何语言，是自动构建完整 Wordnets 的第一步。

Abstract

Manually constructing a wordnet is a difficult task, needing years of experts' time. As a first step to automatically construct full Wordnets, we propose approaches to generate wordnet →

wordnet synsets machine translator bilingual dictionary automatic construction

发现论文，激发创造

使用词向量进行半自动 WordNet 关联

本文提出一种将不同语言的词汇网络进行链接的方法，可用于自然语言处理等知识性应用，能够在目标语言的候选词汇同义词集排名的前十位中为 60％的所有同义词集和 70％的名词同义词集检索出获胜的同义词集。

Jan, 2022

自动创建大量新的双语词典

本文提出了一种自动创建低资源语言，特别是资源贫乏和濒危语言的大量新双语词典的方法，使用一个单一的输入双语词典生成目标语言的单词翻译，依赖于 Wordnets 和机器翻译器（MT）。

Aug, 2022

利用句子嵌入进行词义归纳自动构建 WordNet

该研究提出了一种基于句子嵌入语言模型的自动构建词网的方法，利用未标记的语料库构建了 FilWordNet，该方法在不需人为监督的情况下可以自动感知词义和同义词集。

Apr, 2022

Watset: 从同义词图中自动归纳同义词集

本研究提出了一种基于图的方法，利用同义词词典和词嵌入诱导同义词集。首先，我们建立了一个从常见资源（例如 Wiktionary）中提取同义词的加权图。其次，我们应用词义归纳来处理有歧义的单词。最后，我们将有歧义输入图的已消除歧义版本聚类到同义词集中。虽然方法简单，但在三个由人工构建的大规模词汇资源衍生的英语和俄语的黄金标准数据集上，在 F-score 方面表现出优秀的结果，超越了五种有竞争力的最新方法。

Apr, 2017

创建反向双语词典

本文提出从已有的包含英语的双语词典中创建新的反向双语词典的算法，利用英语 Wordnet 中单词 - 概念对之间的相似性来生成反向词典条目，并且只要其中的一种语言具有 Wordnet 类型的词汇学本体论，这些算法就适用于任何双语词典。

Aug, 2022

推进阿拉伯语词网：提升内容质量

高质量的词网（WordNets）对于依赖此类资源的 NLP 应用程序来说非常重要。为了解决诸如词汇错误、缺失的释义和例句，以及语言形态和语义的不完善等问题，我们对阿拉伯语 WordNet 进行了重大修订，更新了超过 58% 的同义词集。通过添加缺失的信息和纠正错误，同时还扩展了词网结构，引入了新的元素：短语和词汇空缺，以应对语言多样性和不可翻译性的问题。

Mar, 2024

利用 WordNet 同义词集索引可以提高文本检索效果

使用 WordNet synsets 作为索引空间可以提高文本检索的结果，如果查询未消歧时，索引同义词集的表现只能与标准词索引相当。

Aug, 1998

为濒危语言创建词汇资源

本文旨在探讨为濒危语言生成词汇资源的方法，通过使用公共词网和机器翻译器构建双语词典和多语言词库，奠定了一个基础，尤其适用于缺乏资源的语言。

Aug, 2022

印度语言 Wordnet 及其与普林斯顿 WordNet 的链接

本研究为提高南亚次大陆语言自然语言处理技术，发布了 18 种印第安语言 Wordnet 资源。这些资源是专家手工创建的，与普林斯顿 WordNet 连接。

Jan, 2022

利用双语词典进行低资源半监督神经机器翻译

本研究提出了一种基于双语词典的数据增强技术，使得机器翻译模型能够扩展词汇表而不会影响低资源环境下的合成句子的质量，我们的方法在性能上表现出可观的改进。

Apr, 2020