Jul, 2024

重温图上的随机游走学习

TL;DR通过对图的随机游走产生机器可读的记录,并通过深度神经网络处理这些记录,直接进行顶点级或图级的预测,我们重新审视了图上机器学习的一个简单思想。我们称这些随机机器为随机游走神经网络,并表明我们可以设计它们成为同构不变并具备概率下图函数的通用逼近能力。一个有用的发现是,只要顶点匿名,几乎任何种类的随机游走记录都保证了概率不变性。这使得我们能够以纯文本的形式记录随机游走,并采用语言模型读取这些文本记录以解决图任务。我们进一步使用马尔科夫链理论中的工具,建立了与消息传递神经网络的并行性,并表明随机游走神经网络在构建过程中减轻了消息传递中的过度平滑,而概率性不达到则表现为概率性不足。我们展示了基于预训练模型的随机游走神经网络能够解决图上的一些难题,如分离三阶通用 WL 测试失败的强正则图、计数子结构和在 arXiv 引用网络上进行传导分类,而无需训练。代码可在此链接中获取。