利用图神经网络学习基因组序列表示在 De Bruijn 图上的应用

Dec, 2023

利用图神经网络学习基因组序列表示在 De Bruijn 图上的应用

Learning Genomic Sequence Representations using Graph Neural Networks over De Bruijn Graphs

Kacper Kapuśniak, Manuel Burger, Gunnar Rätsch, Amir Joudaki

TL;DR基于同源图网络编码器和节点相似性构建正样本，我们提出了融合上下文信息和结构信息的 k-mer 嵌入方法，用于鲁棒的序列表示，从而在编辑距离近似和最接近字符串检索任务中，始终优于先前技术。

Abstract

The rapid expansion of genomic sequence data calls for new methods to achieve robust sequence representations. Existing techniques often neglect intricate structural details, emphasizing mainly contextual information. To address this, we developed →

genomic sequence data k-mer embeddings de bruijn graphs contrastive learning graph convolutional network

发现论文，激发创造

蛋白质图形的神经嵌入

本文提出了一种利用图神经网络和自然语言大模型生成结构和序列感知型蛋白质表示的新框架，并将其与传统的基于结构对齐的方法相比较，证明了该方法在比较蛋白质结构和蛋白质结构分类任务中的优越性能。

Jun, 2023

密集连接图卷积网络用于图到序列学习

本研究通过图卷积网络（GCN）对图进行编码，引入了一种新的密集连接策略，提出了一种新型的密集连通图卷积网络（DCGCN）来集成本地和非本地特征，以更好地学习图的结构表示，并在 AMR-to-text 生成和基于语法的神经机器翻译上明显优于现有的神经模型。

Aug, 2019

协同深度图聚类网络

使用图神经网络（GNNs）学习连贯且有区分力的节点表示以进行聚类在深层图聚类中已经显示出了良好的结果。然而，现有方法忽视了表示学习与结构增强之间的相互关系。该研究表明，增强嵌入和结构的协同作用对于释放 GNNs 在深层图聚类中的潜力变得必要。可靠的结构促进获取更连贯的节点表示，而高质量的节点表示可以指导结构的增强，从而提高结构的可靠性。此外，现有基于 GNNs 的模型的泛化能力相对较差。尽管它们在具有高同质性的图上表现良好，但在具有低同质性的图上表现较差。为此，我们提出了一个名为 Synergistic Deep Graph Clustering Network（SynC）的图聚类框架。在我们的方法中，我们设计了一个名为 Transform Input Graph Auto-Encoder（TIGAE）的模型来获取高质量的嵌入，并用于引导结构增强。然后，在增强的图上重新捕捉邻域表示以获得适合聚类的嵌入，并进行自监督聚类。值得注意的是，表示学习和结构增强共享权重，从而大大减少了模型参数的数量。此外，我们引入了一种结构微调策略以提高模型的泛化能力。对基准数据集进行的大量实验证明了我们方法的优越性和有效性。代码已在 GitHub 和 Code Ocean 上发布。

Jun, 2024

无监督图对比学习中的结构和语义全局知识获取

本文提出了一种基于结构和语义对比学习算法框架的简单神经网络 - S^3-CL，用于在无监督情况下学习表达具有全局结构和语义的节点特征，通过实验表明与现有的基于 GNN 的无监督 GCL 方法相比，S^3-CL 在不同的下游任务上可以获得优异的表现。

Feb, 2022

基于结构增强的文本表示学习用于高效的知识图谱补全

本研究旨在整合知识图谱的图嵌入和文本编码技术，以提高自动完成知识图谱的性能，实现更精确的链接预测和结构学习。实验结果表明，该方法能实现与文本编码方法相比 1-2 个数量级的推理成本减少和最先进的性能表现。

Apr, 2020

基于压缩图神经网络的在线服务高效用户序列学习

学习用户行为序列的表示对于各种在线服务至关重要，本文介绍了一种名为 ECSeq 的新型统一框架，该框架利用图压缩技术来改善用户序列表示学习的效率问题，并在序列分类和回归任务中展示了 ECSeq 的有效性。

Jun, 2024

MuSe-GNN：从多模态生物图数据中学习统一的基因表示

在这项研究中，我们通过引入一种名为多模态相似性学习图神经网络的新型模型，结合多模态机器学习和深度图神经网络，从单细胞测序和空间转录组学数据中学习基因表示，以解决在不同生物医学环境中发现具有类似功能的基因的挑战。我们的模型通过为模型训练和基因表示生成创建信息丰富的图结构，并结合加权相似性学习和对比学习的正则化，学习跨数据的基因 - 基因关系，从而确保我们能够提供包含功能相似性的基因表示。广泛的基准测试分析显示，我们的模型能够有效地捕捉多种模态下的基因功能相似性，其基因表示学习的性能超过当前最先进方法高达 97.5％。此外，我们将生物信息学工具与基因表示结合使用，揭示通路富集、调控因果网络和与疾病相关或剂量敏感的基因功能。因此，我们的模型能够高效产生用于分析基因功能、组织功能、疾病和物种演化的统一基因表示。

Sep, 2023

基于扩散图的快速序列嵌入

本文提出了一种名为 `Diffusion Graphs` 的图嵌入方法，其通过简单的顶点序列生成可以获得更高的计算效率和更加准确的嵌入结果。实验证明，该方法在图中边密度越大时性能越好，同时在社区检测任务中，利用嵌入空间中的聚类节点可以获得比其他序列嵌入方法更好的结果。

Jan, 2020

Seq-HGNN：学习异构图上的序列节点表示

Seq-HGNN 是一种新颖的异构图神经网络，使用序列节点表示学习机制来表示每个节点的元路径表示序列，并使用异构表示融合模块来聚合这些表示。实验证明，Seq-HGNN 在信息检索方面的性能超过了现有的同类模型。

May, 2023

学习图的深度生成模型

本文介绍了一种基于图神经网络的强大新方法，用于学习生成模型的过程中捕获图的结构和属性。实验证明，相较于不使用图结构表示的基线，我们的模型常常表现更好，是学习任意图的生成模型的第一个最通用的方法，为从矢量和序列式知识表示的限制中走向更具表现力和灵活性的关系型数据结构开辟了新方向。

Mar, 2018