图结构数据上的多标签节点分类
提出了一种基于图卷积网络的多标签分类模型,通过建立对象标签之间的图,学习一个对相互依赖的物体分类器的表示,同时使用重新加权的方法来创建有效的标签相关矩阵以指导 GCN 中节点之间的信息传播,在两个多标签图像识别数据集上实验证明了方法的有效性,并且可视化分析表明该模型学习到的分类器保持有意义的语义拓扑结构。
Apr, 2019
本文提出了一种基于协同式图遍历的强化学习算法,Multi-Label-Graph-Walk,提高了节点嵌入的区分能力,在属性图中利用可用标签分配来调整节点表示,将多标签节点分类任务形式化为多个标签特定代理的同时图遍历,在合作方式中学习标签特定图遍历策略,捕捉节点标签与结构属性之间的关联以及多个标签特定分类任务之间的关联。综合实验研究表明,所提出的方法显著提高了多标签分类性能,实现了更高效的图形探索。
Oct, 2019
本研究提出一种基于标签图叠加框架的多标签识别解决方案,以图卷积网络(GCN)为基础,通过超impose技术建立标签相互作用图,并将其与GCN及CNN的信息交流,以提高特征学习和数据表示。实验表明,该方法大大提高了多标签识别的性能且达到了新的最佳表现。
Nov, 2019
通过实验证明,在许多标准的节点分类基准测试中,结合忽略图结构的浅层模型和利用标签结构相关性的两个简单的后处理步骤可以比GNN在性能上优秀或者与之匹配,同时仅需使用一小部分GNN的参数并拥有更快的运行时间。
Oct, 2020
本文研究机器学习中关于多标签节点分类问题的性能评估方法,发现许多相关研究采用不切实际的标签真值进行预测,导致结果被高估;本文提出了一种简单有效的评估方法,并在此基础上,对主要的图表示学习方法进行了公正深入的比较。
Dec, 2021
本研究提出了一种新的信息伪标签框架(InfoGNN),以最大化互信息为基础,通过伪标签化最具信息代表性的节点来促进使用极少数标记的GNN的学习。同时,也提出了一个广义交叉熵损失函数,并使用类平衡正则化来解决潜在的标签噪音和类不平衡问题。实验证明,该方法在六个真实图数据集上显著优于基线和强自监督方法。
Jan, 2022
本文提出了使用图神经网络(GNN)进行多节点表示学习的理论,介绍和证明了直接聚合单个节点表示无法捕捉节点集中节点间依赖性的弊端,提出了一种区分目标节点和其他节点的标记技巧(Labeling trick)以及将其扩展应用到偏序集、子集和超图中,通过实验证明了该技术可在无向/有向链接预测、超边预测、子图预测等多个任务中提升GNN的性能。
Apr, 2023
通过softmax分布中的Wasserstein距离推断数据集中的隐藏图结构信息,分析节点标签的不均匀性的变化以增强模型性能,针对一些基准模型进行实验验证达到提高模型性能的目的。
Apr, 2023
该文介绍了一种利用大型语言模型和图神经网络相结合的无标签节点分类方法LLM-GNN,在小部分节点上利用语言模型进行注释,然后使用图神经网络对其余大部分节点进行预测,通过开发注释质量启发式和利用语言模型的置信度得分来选择节点,从而提高图神经网络的性能,实验证明了LLM-GNN的有效性。
Oct, 2023
图神经网络在节点分类任务中取得了最先进的结果。本文聚焦于多标签节点分类,通过收集和发布了三个真实的生物数据集,并开发了一个可调参数的多标签图生成器。进一步提出了适用于多标签分类的同质性和跨类邻域相似性的定义,并以 $9$ 个收集的多标签数据集为基础进行了研究。最后,通过对 $8$ 个方法在九个数据集上进行大规模对比研究,评估了目前在多标签节点分类方面的进展。代码已在 https://github.com/Tianqi-py/MLGNC 上发布。
Jun, 2024