SEA: 一个可扩展的实体对齐系统

SIGIRApr, 2023

SEA: A Scalable Entity Alignment System

Junyang Wu, Tianyi Li, Lu Chen, Yunjun Gao, Ziheng Wei

TL;DRSEA 是一种可伸缩的实体对齐系统，借助于图神经网络作为编码器，在实际应用中进行大规模的实体对齐，其包含六个最新的实体对齐模型，能够加速归一化和评估过程。

Abstract

entity alignment (EA) aims to find equivalent entities in different knowledge graphs (KGs). State-of-the-art EA approaches generally use Graph Neural Networks (GNNs) to encode entities. However, most of them train the models and evaluate the results in a fullbatch fashion, which prohib

entity alignment graph neural networks scalability state-of-the-art models real-world applications

发现论文，激发创造

ClusterEA：基于随机训练和归一化小批量相似度的可扩展实体对齐

ClusterEA 是一个通用的框架，利用小批量的高等价率实体，采用规范化方法扩大了实体对齐模型，以解决现有 embedding-based 方法中出现的几何问题，并融入在稀疏矩阵融合的基础上为实体对齐提出了新的 ClusterSampler 策略，该方案能够比现有最先进的可扩展性 EA 框架提高 8 倍的 Hits@1。

May, 2022

通过图增强改进知识图谱实体对齐

本篇论文提出了一种基于图增强的新颖实体对齐方法 GAEA，结合实体 - 关系编码器和图扩充的方法来消除 KG 的结构异质性，进一步提高模型的对齐效果。

Apr, 2023

EchoEA: 实体对齐中的实体和关系之间的回声信息

本篇论文提出了一种基于 Echo 实体对齐的新框架，该框架利用 4 级自注意机制将实体信息传播到关系中并回传到实体，同时提出了属性组合双向全局过滤策略以改进引导和生成高质量训练数据，实验结果表明，此方法在三个现实跨语言数据集上的表现稳定在平均 hits@1 上达到 96%，不仅显著优于现有 GNN-based 方法，还是现有 EA 方法的通用和可转移的。

Jul, 2021

LargeEA: 大规模知识图谱中的实体对齐

LargeEA 通过结构和名称通道相结合的方法实现了大规模知识图谱实体对齐。其中，METIS-CPS 和 NFF 分别用于结构和名称通道。同时，LargeEA 还利用基于名称的数据增强来生成种子对齐结果。实验结果表明，LargeEA 的性能在大规模实体对齐任务中优于当前最先进的方法

Aug, 2021

LightEA: 基于三视图标签传播的可扩展、鲁棒和可解释的实体对齐框架

通过对研究发现，我们在本文中提出了一种非神经网络 EA 框架 LightEA，它包含了 Random Orthogonal Label Generation，Three-view Label Propagation 和 Sparse Sinkhorn Iteration 三个组件，从而达到极佳的可伸缩性、鲁棒性和可解释性，对多个公共数据集的实验证明了其与现有最先进方法可媲美甚至更好的结果。

Oct, 2022

ActiveEA: 神经实体对齐的主动学习

本文提出了一种新的基于主动学习的神经实体对齐框架，通过结合结构感知不确定性抽样策略和单例识别器，以便更有效地建立 Seed Alignment，从而减少成本，并具有较好的泛化性。

Oct, 2021

异构知识图谱上基于 GNN 的实体对齐：新数据集和新方法的反思

本论文通过构建与真实场景相似的高度异质化知识图谱 (HHKG)，并对现有的图神经网络 (GNNs) 实体对齐方法进行实验，发现 GNNs 不能充分利用 HKKG 的结构信息，导致性能不佳。最后，介绍一种简单有效的方法 (Simple-HHEA)，实验结果表明该方法在 HHKG 数据集上的表现优于之前的模型。

Apr, 2023

从对齐到分配：令人沮丧地简单的无监督实体对齐

通过将跨语言实体对齐问题转化为分配问题，我们提出了一种无需神经网络的令人沮丧的简单但有效的无监督实体对齐方法 (SEU)，在所有公共数据集上甚至击败了先进的监督方法，并具有高效性、可解释性和稳定性。

Sep, 2021

利用大型语言模型实现实体对齐的能力解锁

ChatEA 是一个创新的框架，将大型语言模型（LLMs）结合到实体对齐（EA）中，通过 KG-code 翻译模块和对话式的多步推理策略提高准确性和效率。实验证实了 ChatEA 在 EA 任务中的卓越性能，突出了 LLMs 在促进 EA 任务中的潜力。

Feb, 2024

实体对齐中是否需要负样本？一种高性能、可扩展性和健壮性的方法

该研究提出了一种新的实体对齐方法，包含三个新组件：简化的图编码器，对称的无负样本对齐损失和增量式半监督学习。实验证明该方法不仅在性能上超越了现有技术，而且具有出色的可扩展性和鲁棒性。

Aug, 2021