将 ImageNet WordNet Synsets 与维基数据链接

Mar, 2018

将 ImageNet WordNet Synsets 与维基数据链接

Linking ImageNet WordNet Synsets with Wikidata

Finn Årup Nielsen

TL;DR本文介绍我们正在进行的将 ImageNet 和 WordNet 同义词集链接到 Wikidata 项目的努力，并讨论在匹配 Wikidata 和 WordNet 知识图谱时面临的问题。作者展示了如何在深度学习环境中使用链接进行实时非英语图像分类和标注，并探讨了未来的机遇。

Abstract

The linkage of imagenet wordnet synsets to wikidata items will leverage deep learning algorithm with access to a rich →

imagenet wordnet wikidata deep learning multilingual knowledge

发现论文，激发创造

使用词向量进行半自动 WordNet 关联

本文提出一种将不同语言的词汇网络进行链接的方法，可用于自然语言处理等知识性应用，能够在目标语言的候选词汇同义词集排名的前十位中为 60％的所有同义词集和 70％的名词同义词集检索出获胜的同义词集。

Jan, 2022

印度语言 Wordnet 及其与普林斯顿 WordNet 的链接

本研究为提高南亚次大陆语言自然语言处理技术，发布了 18 种印第安语言 Wordnet 资源。这些资源是专家手工创建的，与普林斯顿 WordNet 连接。

Jan, 2022

ConceptNet 5.5: 开放通用多语言知识图谱

本文介绍了一种与现代 NLP 技术（如单词嵌入）特别匹配的概念网路资源 ConceptNet 的新版本，它能够连接自然语言，改善它对单词意义的理解，同时对单词嵌入提供理解和应用，从而提高自然语言应用程序的性能。

Dec, 2016

自动构建 Wordnet 同义词集

通过使用公开的 Wordnets、机器翻译和单语种双语字典，我们提出了一种方法来为资源丰富和资源贫乏的语言生成 Wordnet 同义词集，这些方法适用于至少存在一种从英文翻译到该语言的双语词典的任何语言，是自动构建完整 Wordnets 的第一步。

Aug, 2022

推进阿拉伯语词网：提升内容质量

高质量的词网（WordNets）对于依赖此类资源的 NLP 应用程序来说非常重要。为了解决诸如词汇错误、缺失的释义和例句，以及语言形态和语义的不完善等问题，我们对阿拉伯语 WordNet 进行了重大修订，更新了超过 58% 的同义词集。通过添加缺失的信息和纠正错误，同时还扩展了词网结构，引入了新的元素：短语和词汇空缺，以应对语言多样性和不可翻译性的问题。

Mar, 2024

从 Wikidata 学习为少数语言生成维基百科摘要

本文探讨如何使用 Wikidata 中的结构化数据来生成在 Wikipedia 贫穷语言中的开放领域概要。为此，作者提出了一种神经网络结构，该结构配备有复制操作，可以学习从 Wikidata 三元组中生成单个句子和可理解的文本摘要。作者在阿拉伯语和世界语这两种不同特性的语言上对所提出的方法进行了评估，并证明了它的有效性。

Mar, 2018

DeepType: 神经类型系统发展的多语言实体链接

DeepType 是一种将符号信息显式地集成到神经网络推理过程中的模型，它通过构建类型系统并将其用于限制神经网络输出的符号结构来解决判断结构以及有效地捕捉信息的问题。在实验中，它用于 Entity Linking 任务，优于人工设计类型系统或最近使用深度学习相似性度量的方案，同时使用符号信息可以无需重新训练即可集成新实体。

Feb, 2018

无监督文本 grounding: 将词语与图像概念相连

本研究提出了一种基于深度学习的无监督的文本 grounding（文本与图像上物体的对应关系）方法，并在 ReferIt Game 数据集与 Flickr30k 数据集上分别超过了基线 7.98% 和 6.96%。

Mar, 2018

利用 WordNet 同义词集索引可以提高文本检索效果

使用 WordNet synsets 作为索引空间可以提高文本检索的结果，如果查询未消歧时，索引同义词集的表现只能与标准词索引相当。

Aug, 1998

跨语言知识图谱实体标签映射的统计和神经方法

本研究探讨使用单词和句子对齐技术以及匹配算法来对来自特定多个语言的 Wikidata 实体标签进行对齐，并展示使用该技术能显着提高信息一致性的 F1 得分，尤其是使用句子嵌入技术的方法，这将可以用于机器翻译等领域。

Jun, 2022