每个文档都有其结构:通过图神经网络进行归纳文本分类
本文介绍了一种基于图卷积神经网络的文本分类算法(Text GCN),该算法利用单一的文本图构建并联合学习词和文本的表征,经实验表明,将该算法应用于多个基准数据集后,在无需外部词嵌入和预先知识的情况下,文本 GCN 仍可优于现有的文本分类方法。
Sep, 2018
提出了一种新的基于图神经网络的模型,通过全局参数共享建立每个输入文本的图形而不是整个语料库的单个图形,这种方法支持在线测试,同时提取更多的本地特征和显著降低边缘数量以及内存消耗,在多个文本分类数据集上性能优于现有模型。
Oct, 2019
本研究综述了基于图形神经网络在自然语言处理中的应用,并提出了一个新的分类(基于图构建、图表示学习和基于图的编码器-解码器模型),同时介绍了许多利用GNN的NLP应用程序,并总结了相应的基准数据集、评估指标和开源代码;最后,讨论了利用GNN进行NLP的各种未解决问题以及未来的研究方向。
Jun, 2021
提出一种新的基于 GNN 的稀疏结构学习模型,用于归纳式文档分类,可以解决词汇歧义性、同义性和动态语境相关性等问题,并在多个真实数据集上跑实验,成果优于目前绝大部分其他方法。
Dec, 2021
本研究提出了一种新颖的归纳图卷积网络框架InducT-GCN(InducTive Graph Convolutional Networks for Text classification),用于无额外资源和有限训练数据情况下的归纳图文本分类,通过仅基于训练文档的统计信息构建图并在测试期间进行单向GCN传播,与传统感性学习模型相比,InducT-GCN在五个文本分类基准测试中表现出更好的性能。
Jun, 2022
本文提出了一种新型的异构词-字符文本图融合文档节点,用于更好地学习它们之间的依赖关系,同时提出了两种基于图的神经模型WCTextGCN和WCTextGAT,实验结果表明,这些模型在文本分类和自动文本摘要任务中表现出了更好的性能。
Oct, 2022
本文介绍文本分类的方法,重点讨论基于图神经网络的文本分类,分别从构造机制和学习过程等方面对文本分类方法进行详细介绍,并涵盖数据集,评估指标和实验设计等方面,通过对公开基准测试的综合比较评估和评估指标的优缺点比较,总结出各个技术的优缺点。
Apr, 2023
本研究对基于图的文本表示方法在文本分类中的应用进行了广泛的实证研究,探索了其实际影响和开放挑战。在短文档和长文档数据集上比较了几个GNN架构和BERT的性能,并发现文本输入特征和领域高度相关,尽管BERT表现出色,但在处理短文本时存在收敛困难,而图方法特别有利于处理较长文本。
May, 2023
本研究解决了文本分类中的图神经网络应用问题,提出了一种新的判别图的构建方法和模型。通过将训练语料分割为根据标签形成的无连接子图,并利用点互信息加权边缘,重构文本分类任务为行走分类任务,从而提供了理论支持。
Oct, 2024