- 基于大规模语言模型的复杂本体对齐
本文研究了利用大型语言模型(LLM)以解决复杂本体对齐挑战的应用,采用基于提示的方法和整合丰富本体内容的模块,取得了自动化复杂对齐任务的重要进展。
- 知识图谱中的可推翻推理
人类知识存在不确定性、不精确性、不完整性和不一致性,这对语义网络构成了巨大的挑战。本文介绍了关于与不完美知识有关的直观符号和模型的研究,并将其与关于论证理论的先前工作联系起来。进一步的工作需要从 AIF 本体中汲取灵感,用直观的语法描述推理 - 利用不确定性查询不一致的描述逻辑知识库
本文研究了利用概率语义来处理 Description Logics Knowledge Bases 中的不一致性问题,使之能够在查询时处理不一致的 KBs,且与传统的修复语义进行了比较。
- ORKG-Leaderboards:基于知识图谱的排行榜挖掘系统工作流程
描述了 Orkg-Leaderboard 软件的设计和应用,该软件能够从大量的人工智能实证研究论文中自动提取以任务 - 数据集 - 指标三元组定义的排行榜,并且能够支持学术出版的主要流程,以 LaTeX 文件或 PDF 文件的形式发布,同时 - 实现一种噪声超链接移除系统:基于语义和相关性的方法
本文提出利用语义 Web 技术对超链接进行清理,构建 Web 结构图,并探索了噪音链接对信息检索和链接挖掘算法的影响。研究表明,语义 Web 技术可以准确地清除噪音链接。
- 使用永久词义编号动态映射 Wordnets
提出一种在线算法,可以在加载时将旧版 WordNet 链接更新为较新的英文 WordNet 版本,并自动推导其中词义的映射关系,从而解决其版本不兼容的问题。
- EDUKG: 一种异构可持续的 K-12 教育知识图谱
该论文提出了一种异构的、可持续的 K-12 教育知识图谱 EDUKG, 其中包含了一个交叉学科的本体论、一种从教科书中提取事实知识的方法以及一种通用的实体链接系统。EDUKG 已经发布并且包含超过 2.52 亿个实体和 38.6 亿个三元组 - 基于语义网的分散家庭能源数据提升方法
本文介绍了一个基于本体论的方法,用于在分散的家庭能源系统中管理分辨率为设备级别的数据,以便更好地利用来自互联网和 Web 的各种数据,促进能源可持续发展。
- V-Coder: 知识图谱语义披露的自适应自编码器
本文介绍了在知识图谱中关系消歧的问题,详细介绍了一种名为 V-Coder 的新型可适应自编码器,它能够识别连接不同领域实体的本质关系,从而改善链接预测的语义披露问题。
- 提取传记事件的指南和语料库
本研究提供了一套标准指南用于生命事件的语义注解,以便挖掘出被较少关注的人物生平信息,并可扩展到维基百科等现有的资源中。
- 基于 5W1H 方法探究不同国家在线学习的出现
本研究分析了不同国家的多模式语义 Web 行为数据,以调查在线学习的出现情况,结果可以帮助解释每个国家的在线学习以及相关公众观念、查询、意见、行为和视角。此外,我们还发布了挖掘出的与在线学习有关的大数据集。
- R-GCN: R 可以代表随机
本文介绍了 “随机关系图卷积网络” 的方法,该方法相比 “关系图卷积网络” 表现出色,其中重要的贡献在于信息传递而非学习得到的权重。
- 如何在规模上管理微型机器学习:工业视角
本文提出了一个基于语义 Web 技术的框架,旨在管理 TinyML 模型和 IoT 设备的组合,包括建模信息、组合发现和基准测试,并支持 TinyML 组件的交换和再利用。作者设计了一个神经网络模型本体论,并以 W3C Thing Desc - HaMSE 本体论:使用语义技术支持音乐表示互操作性和音乐学分析
该研究提出了 HaMSE,一种语义技术下的本体论,可描述音乐特征,以解决音乐研究中的一些问题,包括音乐表现和数据定性的关系。
- 语义网技术指标
本文提出了一种基于 10 个评价标准的 SW 技术指数以标准化 SW 技术的开发和 quantitatively 评价。该指数能够指导和评价 SW 技术开发的工作,并经过验证认为是一个有用的标准。
- 基于谓词匹配的实体摘要
本文提出了一种名为 MPSUM 的方法来解决实体概括生成的问题,该方法使用概率主题模型并集成谓词唯一性和对象重要性的想法进行三元组排名,以生成简洁但代表性的实体概括。在使用 DBpedia 和 LinkedMDB 数据集进行对比实验后,结果 - 众包标注群体真相的经验方法学
本篇文章提出了使用 CrowdTruth 衡量指标来有效地收集多领域多任务的 ground truth 数据,比传统的投票方式更具优势,并研究了人数增加对标注质量的影响。
- 走向语义网上的问答系统
本文提出了一种基于 SPARQL 查询的多语言语义 Web 知识库问答(QA)方法,能够查询多个知识库,可轻松移植到其他知识库和语言。通过对五个不同的知识库和五种语言的评估,证明了该方法的影响。
- MM大规模 OWL 推理
本文介绍了在 Semantic Web 环境下,如何有效地处理数十亿组三元组数据的一些方法,包括利用 OWL 和其子语言,以及前向和后向链接技术。还详细讨论了 WebPIE reasoner,QueryPIE reasoner,OWLIM - OntoSeg: 使用本体相似性的文本分割新方法
本文提出了一种基于本体相似性的文本分割方法,使用 Hierarchical Agglomerative Clustering 算法生成一种树形分层结构,用于表征文本的概念结构,从而实现在不同粒度级别上的线性文本分割,实验证明该方法具有很高的