动态图中链路预测算法评估的新视角
本文研究了动态网络数据中过采样的问题,发现它会影响许多算法问题的质量,尤其是在边预测任务中。作者提出了一种新颖的生成式噪声模型,并利用边预测来恢复过采样效应。作者在合成和实际数据上进行了实验验证。
Apr, 2015
提出了新的评估过程和数据集,以更好地比较不同方法在时间演化图中的强弱,并提出了EdgeBank纯记忆基线,该基线有效地解决了当前评估设置中容易的负面边问题,并通过提出更具挑战性的负采样策略改进了鲁棒性和更好地匹配了现实世界的应用。
Jul, 2022
最近发布的时间图基准被分析在动态链接属性预测的背景下,我们提出了一个简单的无优化基线,即“最近流行节点”,在时间图基准的所有中型和大型数据集上优于其他方法。我们提出了两种基于Wasserstein距离的度量方式,可以量化数据集的短期和长期全局动态的强度。通过分析我们出乎意料的强基线,我们展示了标准的负采样评估对于具有强时间动态的数据集可能不适用。我们还展示了简单的负采样在训练过程中可能导致模型退化,导致无法排名的、完全饱和的预测结果。我们提出了改进的负采样方案,用于训练和评估,并证明了它们的有用性。我们与非对比训练的模型进行了比较,没有进行负采样。我们的结果提供了一个具有挑战性的基准,并表明时间图网络架构在具有重大全局动态的问题中,如社交媒体、加密货币市场或电子商务中,需要进行深入的思考。我们公开发表了基线、测量和提出的负采样方案的代码。
Sep, 2023
通过将节点定义为牛顿对象并引入速度的概念,我们提出了一种新的时间链接预测方法,通过计算每个节点的具体动态,而不是整体动态,提高了预测未来连接的准确性和可解释性。我们的方法在预测合著网络中的未来合作效果方面,使下游分类模型的性能提高了17.34%(相对于基准模型)并针对时间链接预测问题提供了一个可解释的层。
Jan, 2024
TGX是一个Python软件包,特别设计用于分析时态网络,它提供数据加载、数据处理和演化图分析的自动化流程,支持多种内置和外部数据集,并且提供了数据处理功能和网络分析方法,适用于社交网络、引用网络和用户互动等领域。
Feb, 2024
连续时间动态图中的异常检测是一个新兴领域,本文通过结构化分析以及图表示学习,对这些图中的异常连接进行识别。通过引入精细分类法并将类型化的异常注入图中,我们的方法可以在时间、结构和上下文三个方面产生具有一致模式的连续时间动态图,从而使得时间图方法能够学习到链接异常检测任务。在合成和真实数据集上进行的综合实验通过验证我们的异常和正常图形的分类法、生成过程以及对链接预测方法的异常检测适应方法。我们的研究结果进一步揭示了不同学习方法在捕捉图形正常性的不同方面和检测不同类型异常方面的优势,为未来的研究提供了机遇。
May, 2024
本研究通过重新构建动态连接预测作为链接预测任务,更好地考虑了数据中的时间信息,解决了常见评估方法引起的模型性能不准确和方法公平比较困难的问题。
Jun, 2024
动态链接预测是对演化网络进行分析的关键任务,研究范围从推荐系统到经济交易。通过对多个数据集和模型进行综合分析,我们形式化了动态图学习中时间感知域的作用,并强调了它们对预测准确性的关键影响。我们的结果表明,恰当选择的时间感知域可以显著提高模型性能,但对于某些模型来说,过大的窗口可能会引入噪音并降低准确性。我们进行了大量的基准测试来验证我们的发现,并确保所有实验都可以完全再现。
Jul, 2024