阿拉伯语本体论:一种具备本体干净内容的阿拉伯词网
高质量的词网(WordNets)对于依赖此类资源的 NLP 应用程序来说非常重要。为了解决诸如词汇错误、缺失的释义和例句,以及语言形态和语义的不完善等问题,我们对阿拉伯语 WordNet 进行了重大修订,更新了超过 58% 的同义词集。通过添加缺失的信息和纠正错误,同时还扩展了词网结构,引入了新的元素:短语和词汇空缺,以应对语言多样性和不可翻译性的问题。
Mar, 2024
本文介绍了为印度语言量身定制的动词中心词汇资源 OntoSenseNet 的丰富,其重要贡献之一是通过开发一个计算版本来保留 Telugu 词典的原汁原味。手动注释的黄金标准语料库共包含 8483 个动词、253 个副词和 1673 个形容词,并由本地语言人士根据定义的注释指南进行注释。本文提供了注释过程的概述,并通过互注器协议的验证,验证了所开发资源的有效性。
Jul, 2018
人工智能本体论(AIO)是一个人工智能(AI)概念、方法论及其相互关系的系统化体系。通过手动整理和大语言模型(LLMs)的辅助开发,AIO 旨在通过提供一个全面框架,涵盖技术和伦理两个方面的人工智能技术,来应对人工智能领域迅速发展的局面。
Apr, 2024
本研究旨在建立一份当代阿拉伯文语料库,收集了包括 8 个阿拉伯国家 10 个主要新闻来源的报纸文章,共计超过 5 百万篇文章,包含 15 亿个单词,标记了 SGML 和 XML 两种标记语言,并使用 UTF-8 和 Windows CP-1256 两种编码格式。
Nov, 2016
通过定量研究 Wordnet 数据库的语义网络结构,我们发现语义链接遵循自组织网络的幂率尺度不变行为,而多义词作为一个单词在语义网络中起到了联系不同含义的作用。包含多义链接会对语义图的组织产生深远的影响,形成了一个小世界,并呈现出高流量聚类(枢纽)代表抽象概念。因此,我们的结果表明,多义词组织具有紧凑和分类的表现形式,并可能解释多义词在各种语言中的普遍存在。
Jun, 2001
我们介绍了 Qabas,这是一个新颖的开源阿拉伯词典,用于自然语言处理应用。Qabas 综合了 110 个词典,将词条通过链接的方式组合在一起,并且还与 12 个形态标注的语料库链接,使其成为首个与词典和语料库进行链接的阿拉伯词典。Qabas 是通过半自动化方式开发的,利用了一个映射框架和一个基于 Web 的工具。与其他词典相比,Qabas 是最全面的阿拉伯词典之一,包括约 58,000 个词条(45,000 个名词词条,12,500 个动词词条和 473 个功能词词条)。Qabas 是开源的,可以在网上访问。
Jun, 2024
本文回顾了多语义 Web 中的语言多样性建模选项,通过对 9 种主要方法进行比较,从 BioPortal 和 LOV 存储库中提取了可访问的本体,并评估了 7 个相关本体编辑器对于管理多语言本体的工具支持。
Oct, 2022
该研究介绍了一个包含科学技术领域中非传统主题的自动化科学技术本体,并通过连接不同领域和专业之间相关或具有共性的主题来促进跨学科研究与合作。使用从 2021 年 10 月到 2022 年 8 月从语义学者 (Semantic Scholar) 收集的 393,991 篇科学文章构建 S&TO。目前,S&TO 划分了四个科学领域中的 5153 个主题和 13155 个语义关系,可以通过对更新的数据集运行 BERTopic 来更新模型。
May, 2023
本文旨在提供一个对混合智能的本体论应用和混合智能系统中本体论应用的批判性讨论,以减少人工智能和人类智能之间的差距,提高系统的质量和准确性,增强互操作性和透明度,并探索下一代混合智能环境的建立。
Mar, 2023