将 ImageNet WordNet Synsets 与维基数据链接
本文提出一种将不同语言的词汇网络进行链接的方法,可用于自然语言处理等知识性应用,能够在目标语言的候选词汇同义词集排名的前十位中为 60%的所有同义词集和 70%的名词同义词集检索出获胜的同义词集。
Jan, 2022
本研究为提高南亚次大陆语言自然语言处理技术,发布了 18 种印第安语言 Wordnet 资源。这些资源是专家手工创建的,与普林斯顿 WordNet 连接。
Jan, 2022
本文介绍了一种与现代 NLP 技术(如单词嵌入)特别匹配的概念网路资源 ConceptNet 的新版本,它能够连接自然语言,改善它对单词意义的理解,同时对单词嵌入提供理解和应用,从而提高自然语言应用程序的性能。
Dec, 2016
通过使用公开的 Wordnets、机器翻译和单语种双语字典,我们提出了一种方法来为资源丰富和资源贫乏的语言生成 Wordnet 同义词集,这些方法适用于至少存在一种从英文翻译到该语言的双语词典的任何语言,是自动构建完整 Wordnets 的第一步。
Aug, 2022
高质量的词网(WordNets)对于依赖此类资源的 NLP 应用程序来说非常重要。为了解决诸如词汇错误、缺失的释义和例句,以及语言形态和语义的不完善等问题,我们对阿拉伯语 WordNet 进行了重大修订,更新了超过 58% 的同义词集。通过添加缺失的信息和纠正错误,同时还扩展了词网结构,引入了新的元素:短语和词汇空缺,以应对语言多样性和不可翻译性的问题。
Mar, 2024
本文探讨如何使用 Wikidata 中的结构化数据来生成在 Wikipedia 贫穷语言中的开放领域概要。 为此,作者提出了一种神经网络结构,该结构配备有复制操作,可以学习从 Wikidata 三元组中生成单个句子和可理解的文本摘要。作者在阿拉伯语和世界语这两种不同特性的语言上对所提出的方法进行了评估,并证明了它的有效性。
Mar, 2018
DeepType 是一种将符号信息显式地集成到神经网络推理过程中的模型,它通过构建类型系统并将其用于限制神经网络输出的符号结构来解决判断结构以及有效地捕捉信息的问题。在实验中,它用于 Entity Linking 任务,优于人工设计类型系统或最近使用深度学习相似性度量的方案,同时使用符号信息可以无需重新训练即可集成新实体。
Feb, 2018
本研究提出了一种基于深度学习的无监督的文本 grounding(文本与图像上物体的对应关系)方法,并在 ReferIt Game 数据集与 Flickr30k 数据集上分别超过了基线 7.98% 和 6.96%。
Mar, 2018
使用 WordNet synsets 作为索引空间可以提高文本检索的结果,如果查询未消歧时,索引同义词集的表现只能与标准词索引相当。
Aug, 1998
本研究探讨使用单词和句子对齐技术以及匹配算法来对来自特定多个语言的 Wikidata 实体标签进行对齐,并展示使用该技术能显着提高信息一致性的 F1 得分,尤其是使用句子嵌入技术的方法,这将可以用于机器翻译等领域。
Jun, 2022