SEA: 一个可扩展的实体对齐系统
ClusterEA 是一个通用的框架,利用小批量的高等价率实体,采用规范化方法扩大了实体对齐模型,以解决现有 embedding-based 方法中出现的几何问题,并融入在稀疏矩阵融合的基础上为实体对齐提出了新的 ClusterSampler 策略,该方案能够比现有最先进的可扩展性 EA 框架提高 8 倍的 Hits@1。
May, 2022
本篇论文提出了一种基于 Echo 实体对齐的新框架,该框架利用 4 级自注意机制将实体信息传播到关系中并回传到实体,同时提出了属性组合双向全局过滤策略以改进引导和生成高质量训练数据,实验结果表明,此方法在三个现实跨语言数据集上的表现稳定在平均 hits@1 上达到 96%,不仅显著优于现有 GNN-based 方法,还是现有 EA 方法的通用和可转移的。
Jul, 2021
LargeEA 通过结构和名称通道相结合的方法实现了大规模知识图谱实体对齐。其中,METIS-CPS 和 NFF 分别用于结构和名称通道。同时,LargeEA 还利用基于名称的数据增强来生成种子对齐结果。实验结果表明,LargeEA 的性能在大规模实体对齐任务中优于当前最先进的方法
Aug, 2021
通过对研究发现,我们在本文中提出了一种非神经网络 EA 框架 LightEA,它包含了 Random Orthogonal Label Generation,Three-view Label Propagation 和 Sparse Sinkhorn Iteration 三个组件,从而达到极佳的可伸缩性、鲁棒性和可解释性,对多个公共数据集的实验证明了其与现有最先进方法可媲美甚至更好的结果。
Oct, 2022
本文提出了一种新的基于主动学习的神经实体对齐框架,通过结合结构感知不确定性抽样策略和单例识别器,以便更有效地建立 Seed Alignment,从而减少成本,并具有较好的泛化性。
Oct, 2021
本论文通过构建与真实场景相似的高度异质化知识图谱 (HHKG),并对现有的图神经网络 (GNNs) 实体对齐方法进行实验,发现 GNNs 不能充分利用 HKKG 的结构信息,导致性能不佳。最后,介绍一种简单有效的方法 (Simple-HHEA),实验结果表明该方法在 HHKG 数据集上的表现优于之前的模型。
Apr, 2023
通过将跨语言实体对齐问题转化为分配问题,我们提出了一种无需神经网络的令人沮丧的简单但有效的无监督实体对齐方法 (SEU),在所有公共数据集上甚至击败了先进的监督方法,并具有高效性、可解释性和稳定性。
Sep, 2021
ChatEA 是一个创新的框架,将大型语言模型(LLMs)结合到实体对齐(EA)中,通过 KG-code 翻译模块和对话式的多步推理策略提高准确性和效率。实验证实了 ChatEA 在 EA 任务中的卓越性能,突出了 LLMs 在促进 EA 任务中的潜力。
Feb, 2024
该研究提出了一种新的实体对齐方法,包含三个新组件:简化的图编码器,对称的无负样本对齐损失和增量式半监督学习。实验证明该方法不仅在性能上超越了现有技术,而且具有出色的可扩展性和鲁棒性。
Aug, 2021