ActiveEA: 神经实体对齐的主动学习
本文提出了一种基于深度学习和主动学习的知识图谱对齐方法 DAAKG,通过学习实体、关系和类的嵌入并在半监督情况下联合对齐它们,同时估计最佳批次用于人工标注,提高实体,关系或类的推断准确率。实验表明,DAAKG 具有出色的准确性和推广性。
Apr, 2023
本文提出一个基于增强学习的模型用于收集实体对齐数据,并通过一些限制和特征融合策略来提高模型性能,最后在跨语言和单语言的数据集上经过实证分析证实其有效性和优越性。
Jan, 2021
通过设计一种新颖的主动学习策略以及引入无监督标签优化方法,我们提出了一个统一的框架 LLM4EA,以有效地利用大型语言模型自动化实体对齐,并在四个基准数据集上进行了广泛实验,证明了其在效果、鲁棒性和效率方面的优势。
May, 2024
本文提出了一种无监督框架,用于在开放世界中进行实体对齐。该框架挖掘了知识图谱的旁路信息,过滤掉无法匹配的实体,通过渐进式学习框架不断改进结构嵌入,从而提升对齐质量,同时不需要标记数据。
Jan, 2021
通过在实体对齐模型中注入兼容性的性质,我们提出了一种训练框架,以利用在知识图谱中各个实体之间潜在的依赖关系,可用少量标记数据进行训练,却能达到同标准监督训练所得的效果,验证了该技术的优势。
Nov, 2022
ClusterEA 是一个通用的框架,利用小批量的高等价率实体,采用规范化方法扩大了实体对齐模型,以解决现有 embedding-based 方法中出现的几何问题,并融入在稀疏矩阵融合的基础上为实体对齐提出了新的 ClusterSampler 策略,该方案能够比现有最先进的可扩展性 EA 框架提高 8 倍的 Hits@1。
May, 2022
本文对不同的实体对齐方法进行了全面分析,其中主要以基于知识图谱的低维嵌入算法为主,同时提出了四个研究问题并对应用场景和局限性进行了讨论,根据工业数据集中的难点以 extit {Hubness, Degree distribution, Non-isomorphic neighbourhood,} 和 extit {Name bias} 等四个方面进行了实证分析,提出了一个低名称偏倚数据集,并创建了一个开源库,包括 14 种嵌入式实体对齐方法用于进一步研究。
May, 2022