该研究采用零样本和少样本提示以及多个开放式大型语言模型应用于本体匹配评估任务,通过少量示例和良好设计的提示,实现与使用更大比例的真实数据的监督匹配系统相媲美的结果。
Nov, 2023
为解决 Ontology Matching 中评价体系不全的问题,该研究提出了五个新的医学本体匹配任务,并且提出了一个全面的评价框架,对机器学习和非机器学习的匹配系统进行了评估。该研究的资源已经公开发布在 OAEI 2022 的 BioML 赛道中。
May, 2022
本文基于知识图谱嵌入探索了一种新的基于结构的映射方法,并使用合成和真实数据集进行了初步评估,结果表明,该方法对相似结构的图形具有很好的处理能力,可优于处理本体的大小和结构差异的对齐噪声。
Apr, 2022
LLMs4OM 框架通过零样本提示技术,利用大型语言模型在本体匹配任务中评估大型语言模型的效果,并在不同本体表示(概念、概念父类、概念子类)之间实现检索和匹配两个模块,全面评估了 20 个不同领域的本体匹配数据集,结果表明,在复杂匹配场景下,LLMs 在 LLMs4OM 框架下的性能可以与甚至超过传统的本体匹配系统,凸显了 LLMs 在本体匹配领域的潜力。
Apr, 2024
本文提出了一种新的实体对齐框架,使用基于图结构的弱优化的图对比学习算法和 PageRank 算法,结合两个学习目标:对比学习和最优传输学习,以利用实体之间的结构相似性来解决具有悬挂实体的实体对齐问题。实验结果表明这种方法在处理传统(宽松)和悬挂(聚合)实体对齐情况时,比当前最先进的基于纯结构信息的方法具有更好的性能。
Apr, 2023
本文提出了一个自匹配训练方法,对本体嵌入模型进行训练,包括倒排索引矩阵嵌入(InME)和共现矩阵嵌入(CoME),以捕捉本体注释公理中的全局和局部信息。通过自匹配训练方法,在预测超类与子类相似且与本体中其他实体孤立的情况下,可以提高概念包含预测的鲁棒性。实验证实,在 GO 和 FoodOn 本体中,使用 InME 的自匹配训练方法优于现有的本体嵌入方法;而在 HeLiS 本体中,使用 CoME 和 OWL2Vec * 的连接方法优于其他方法。
Feb, 2024
本文介绍了一个用于评估本体完成方法的基准,并对两种方法的优势和弱点进行了深入分析。我们发现这两种方法确实相辅相成,混合策略取得了最佳的整体效果。我们还发现,即使经过微调,本任务对大型语言模型来说仍然具有很高的挑战性。
Mar, 2024
本文研究了利用大型语言模型(LLM)以解决复杂本体对齐挑战的应用,采用基于提示的方法和整合丰富本体内容的模块,取得了自动化复杂对齐任务的重要进展。
我们提出了一个潜在同构传播算子来加强跨知识图谱的邻居信息传播,以提高聚合型模型的准确性,并展示了 PipEA 在弱监督实体对齐方面取得的显著性能提升。
本文从应用角度探讨了基于本体匹配的数据集成问题,通过实际数据和现有工具的支持进行实验,发现自动本体匹配过程中存在的错误和不确定性,探索了半监督方法在更广泛应用中的成熟性和不确定性管理方面的前景
Oct, 2023