引入了一种新的深度学习架构,基于卷积神经网络,使用在系统发生树上定义的祖先距离作为相似度测量来分类元基因组数据,测试表明该算法在分类表现上与传统算法和基线全连接神经网络相比有很好的表现。
Sep, 2017
这篇研究论文介绍了一种名为 ProteinNet 的数据集,在蛋白质序列-结构关系的机器学习模型的训练和评估方面提供了一种标准化机制,并提出了一种方法来克服已有数据集中存在的一些挑战。
Feb, 2019
该论文提出了一种称为RepBin的新型方法,它使用图形进行基因组学子序列的表示和聚类,并通过建模生物约束来提供有关节点的信号,并改善了元基因组学binning的状态和图形表示学习的最新技术。
Dec, 2021
该研究提出了一种基于深度学习的亚细胞结构预测模型(SSP),并使用Re-parameterizing Mixture-of-Diverse-Experts(RepMode)来处理具有多尺度问题和部分标签数据的预测任务,以实现在3D成像中对多个亚细胞结构预测的高效和准确性。
Dec, 2022
基于同源图网络编码器和节点相似性构建正样本,我们提出了融合上下文信息和结构信息的k-mer嵌入方法,用于鲁棒的序列表示,从而在编辑距离近似和最接近字符串检索任务中,始终优于先前技术。
Dec, 2023
通过引入 DNABERT-S模型对 DNA 进行嵌入,结合 Manifold Instance Mixup 和 Curriculum Contrastive Learning(C2LR)策略,本研究在基因组学分析中取得了显著的性能提升,尤其在元基因组分组和物种分类方面表现突出。
Feb, 2024
通过蛋白质基因表示为基础,引入了一种上下文感知和结构相关的分词器,即Masked Gene Modeling(MGM)用于基因组级预训练,Triple Enhanced Metagenomic Contrastive Learning(TEM-CL)用于基因级预训练,提出了一种新颖的 metagenomic language model(NAME),基于1亿个元基因组序列进行了预训练,并在八个数据集上展示了其卓越性能。
我们提出了一种创新的深度神经网络模型,通过`学生'和`教师'子网络之间的协同学习,结合了掩蔽学习和对比学习,从而在个体序列的语境信息和序列总体分布数据之间有效融合,该方法显著提升了大多数推理任务的性能。
May, 2024
CGRclust是一种结合了无监督孪生对比聚类和卷积神经网络的创新方法,用于DNA序列的图像分类聚类,能够准确地对各种DNA序列数据集进行聚类,并在18.70%的准确性上超过其他三种DNA序列聚类方法。
Jul, 2024
我们使用图卷积技术设计了一种名为gFlora的方法,该方法通过分析土壤微生物群落的生态共存网络,发现功能共响应群的共响应效果,并证明该方法在评价指标上优于现有方法,同时还发现了有关少数研究的微生物群的新的功能证据。