使用图卷积网络建模文档结构相似性进行连贯度评估
本研究提出一种层次神经网络模型,通过多任务学习,同时预测文档层次的信息连贯得分和词级别的语法角色,利用两个任务之间的归纳转移,提高模型泛化能力,并在不同任务中达到了新的最优表现。
Jul, 2019
本研究提出了一种基于图的文本建模方法和双向神经网络模型,用于跨模态信息检索,结合卷积神经网络和 Graph Convolutional Network,通过相似度度量,并采用成对相似度损失函数训练模型,在准确率提升了 17%的前提下,成为了最先进的方法。
Feb, 2018
我们提出了一种新的文档布局分析方法,即 Doc-GCN ,该方法通过构建图形来描述文档的固有特征并将这些信息应用于图卷积网络中。最终结果表明,我们的方法在三个常用的 DLA 数据集中取得了新的最佳结果。
Aug, 2022
本文提出了三种新的文档连贯度测量指标,应用于文档的双分图以及连贯实体;经过标准测算,其中一项文档连贯度指标实现了最高的准确度,并且这些指标都有效地提高了 IR 的效率,而这些方面是基于关键字的常规排序和垃圾邮件过滤所无法检测到的。
Aug, 2016
本文提出了 GraphSTONE,一种基于 GCN 模型的结构话题神经网络,利用图的主题模型,从概率角度捕获广泛的指示性图结构。同时,通过设计多视图 GCN 统一节点特征和结构主题特征,并利用结构主题来指导聚合,从而达到高效和可解释性。
Jun, 2020
本文提出了一种基于图形表示的模型,并演示了我们不仅可以跨文档检索语义相似的信息,而且我们生成的嵌入空间也捕获了有用的语义信息,类似于仅适用于文本序列的语言模型。
Feb, 2022
本文介绍了一种名为 Graph Topic Model (GTM) 的基于图形神经网络 (GNNs) 的神经主题模型,通过信息交互捕捉图形节点之间的关系,将文档和词汇转化成为图中的节点,并根据共现性连接,通过图卷积汇聚邻居节点信息从而通过共享单词在文档之间建立关系,扩充了文档的主题的表达方式。研究者还基于三个数据集开展了广泛的实验,其结果证明了这种方法的有效性。
Sep, 2020