基于扩散的图网络负采样在链接预测中的应用
本文研究图表示学习中的负采样对于优化目标和结果方差的重要性,并提出了一种基于自对比近似和 Metropolis-Hastings 加速的负采样方法,MCNS,应用于链接预测、节点分类等任务,并在 19 个实验设置中证明了其优越性。
May, 2020
本文通过实证研究,对比了对知识图谱中实体之间关系进行无监督学习的四种嵌入模型( escal,TransE,DistMult 和 ComplEX)使用不同负采样方法的效果,结果发现使用不同负采样方法得到的效果差异较大,且在不同数据集上表现也各有不同。
Aug, 2017
通过精心设计的 MeBNS 框架,以元学习支持的教师 - 学生 GNN 为基础,具备元学习的样本再加权模块,实现了当前基于负样本采样的链接预测器的改进,达到显著性能,适用于六个链接预测基准数据集。
Dec, 2023
通过对负采样的可能性进行分类,并引入新的可视化方法以研究预测性能和时间网络动态,我们验证了错误通常在不同数据段之间不均匀分布,并认为这些可视化工具可以成为评估不同层次的动态链接预测方法的强大指南。
Nov, 2023
图神经网络(GNNs)用于链接预测,有两种广泛的分类。首先,以节点为基础的体系结构为每个节点预先计算个体嵌入,之后由简单的解码器组合以作出预测。与推理时的极高效性相比(因为节点嵌入只计算一次并重复使用),模型的表达能力有限,即对候选边贡献的同构节点可能无法区分,从而损害准确性。相反,基于边的方法依赖于形成特定于边的子图嵌入以丰富对配对关系的表示,以消除同构节点以提高准确性,但代价是增加模型复杂性。为了更好地权衡这种权衡,我们提出了一种新颖的 GNN 体系结构,其中 “前向传递” 显式依赖于正向(一般情况下)和负向(我们方法独有)边,以摄入更灵活但仍然廉价的以节点为基础的嵌入。通过将嵌入自身重新定义为正负样本分离的正向传递特定能量函数(与实际训练损失不同),所提出的体系结构在广泛的经验评估中得到了验证,既保持了以节点为基础的模型的推理速度,又产生了与基于边的替代方法竞争性的准确性。
Oct, 2023
本文提出了一种基于图神经网络的社交推荐模型 NeMo,使用生成式负采样策略并利用正负用户 - 物品交互推广用户兴趣,提高了推荐泛化能力和准确度。实验证明,在各种真实世界的基准数据集上(例如在 NDCG@15 方面高达 38.8%)NeMo 的性能优于现有方法。
Apr, 2023
通过提出 Birth-Death 图、负采样方法的分类、进行实证研究以及可视化探索,全面评估了动态链接预测算法的性能差异和负采样策略对测试 AUC 的影响。
May, 2024
最近发布的时间图基准被分析在动态链接属性预测的背景下,我们提出了一个简单的无优化基线,即 “最近流行节点”,在时间图基准的所有中型和大型数据集上优于其他方法。我们提出了两种基于 Wasserstein 距离的度量方式,可以量化数据集的短期和长期全局动态的强度。通过分析我们出乎意料的强基线,我们展示了标准的负采样评估对于具有强时间动态的数据集可能不适用。我们还展示了简单的负采样在训练过程中可能导致模型退化,导致无法排名的、完全饱和的预测结果。我们提出了改进的负采样方案,用于训练和评估,并证明了它们的有用性。我们与非对比训练的模型进行了比较,没有进行负采样。我们的结果提供了一个具有挑战性的基准,并表明时间图网络架构在具有重大全局动态的问题中,如社交媒体、加密货币市场或电子商务中,需要进行深入的思考。我们公开发表了基线、测量和提出的负采样方案的代码。
Sep, 2023