自动构建 Wordnet 同义词集
本文提出一种将不同语言的词汇网络进行链接的方法,可用于自然语言处理等知识性应用,能够在目标语言的候选词汇同义词集排名的前十位中为 60%的所有同义词集和 70%的名词同义词集检索出获胜的同义词集。
Jan, 2022
本文提出了一种自动创建低资源语言,特别是资源贫乏和濒危语言的大量新双语词典的方法,使用一个单一的输入双语词典生成目标语言的单词翻译,依赖于 Wordnets 和机器翻译器(MT)。
Aug, 2022
该研究提出了一种基于句子嵌入语言模型的自动构建词网的方法,利用未标记的语料库构建了 FilWordNet,该方法在不需人为监督的情况下可以自动感知词义和同义词集。
Apr, 2022
本研究提出了一种基于图的方法,利用同义词词典和词嵌入诱导同义词集。首先,我们建立了一个从常见资源(例如 Wiktionary)中提取同义词的加权图。其次,我们应用词义归纳来处理有歧义的单词。最后,我们将有歧义输入图的已消除歧义版本聚类到同义词集中。虽然方法简单,但在三个由人工构建的大规模词汇资源衍生的英语和俄语的黄金标准 数据集上,在 F-score 方面表现出优秀的结果,超越了五种有竞争力的最新方法。
Apr, 2017
本文提出从已有的包含英语的双语词典中创建新的反向双语词典的算法,利用英语 Wordnet 中单词 - 概念对之间的相似性来生成反向词典条目,并且只要其中的一种语言具有 Wordnet 类型的词汇学本体论,这些算法就适用于任何双语词典。
Aug, 2022
高质量的词网(WordNets)对于依赖此类资源的 NLP 应用程序来说非常重要。为了解决诸如词汇错误、缺失的释义和例句,以及语言形态和语义的不完善等问题,我们对阿拉伯语 WordNet 进行了重大修订,更新了超过 58% 的同义词集。通过添加缺失的信息和纠正错误,同时还扩展了词网结构,引入了新的元素:短语和词汇空缺,以应对语言多样性和不可翻译性的问题。
Mar, 2024
使用 WordNet synsets 作为索引空间可以提高文本检索的结果,如果查询未消歧时,索引同义词集的表现只能与标准词索引相当。
Aug, 1998
本研究为提高南亚次大陆语言自然语言处理技术,发布了 18 种印第安语言 Wordnet 资源。这些资源是专家手工创建的,与普林斯顿 WordNet 连接。
Jan, 2022
本研究提出了一种基于双语词典的数据增强技术,使得机器翻译模型能够扩展词汇表而不会影响低资源环境下的合成句子的质量,我们的方法在性能上表现出可观的改进。
Apr, 2020