为本体填充设计的文档结构感知关系图卷积网络
在大规模跨学科数据集 CORD-19 上进行实证研究,结果表明我们提出的面向语义的图形函数可以通过 BM25 检索的候选项达到更好和更稳定的性能,这可以作为未来开发文档检索和分类等文本推理任务的有效图神经网络的指导。
Jan, 2022
本文提出了一种新方法,将知识图谱作为先验知识,通过机器学习、图匹配和修改频繁子图挖掘来语义注释结构化数据源。我们的评估显示,在只知道少量语义模型的棘手情况下,我们的方法优于两种最先进的解决方案。
Dec, 2022
我们提出了一种新的文档布局分析方法,即 Doc-GCN ,该方法通过构建图形来描述文档的固有特征并将这些信息应用于图卷积网络中。最终结果表明,我们的方法在三个常用的 DLA 数据集中取得了新的最佳结果。
Aug, 2022
本文介绍了一种名为 Graph Topic Model (GTM) 的基于图形神经网络 (GNNs) 的神经主题模型,通过信息交互捕捉图形节点之间的关系,将文档和词汇转化成为图中的节点,并根据共现性连接,通过图卷积汇聚邻居节点信息从而通过共享单词在文档之间建立关系,扩充了文档的主题的表达方式。研究者还基于三个数据集开展了广泛的实验,其结果证明了这种方法的有效性。
Sep, 2020
我们介绍了关系图卷积网络 (R-GCNs) 并将它们应用于标准的知识库补全任务,包括链接预测和实体分类。R-GCNs 旨在应对实际知识库中高度多关系数据的特点,我们证明了它们作为一个独立模型在实体分类方面的有效性,并进一步证明,通过在关系图中累积多个推理步骤的编码器模型来丰富解码器模型,可以极大地提高因子分解模型 (例如 DistMult) 在链接预测方面的表现 (在 FB15k-237 上的表现提高了 29.8%)。
Mar, 2017
本文研究了利用学习表示的空间的内在几何结构来实现自动遵守复杂结构约束的本体 (分层和部分有序结构) 学习的最新工作,并探讨了对一种此类模型的两种扩展,旨在提高通识知识表示文本数据的性能。通过混合学习排序关系和非分层知识,以及利用训练数据的部分有序结构找到在配对训练过程中不好执行的嵌入之间的长距离 triplet 约束,我们发现这两种扩展都优于原始的 order-embedding 模型和其他强基线模型。
Aug, 2017
研究了一种基于 GCN 的连贯性模型,能够捕捉文档之间的结构相似性,实现对语篇的连贯性评估和自动化文本评分,并在两个任务中实现了总体最佳。
Jun, 2023
本文提出一种基于图网络架构的表格识别方法,在视觉特征提取方面融合了卷积神经网络的优势;实验证明该方法优于基准线方法。此外,为了解决大规模数据集问题,文中提出了一种合成数据集,并开源了数据集生成及图网络训练框架,以推进研究的可复制性。
May, 2019
本研究提出了一种利用自动带引的潜在文档级图进行跨句子的关系推理的方法,并通过增量聚合相关信息来提高多跳推理的准确性,取得了在 DocRED,CDR 和 GDA 数据集上的最新最优性能。
May, 2020