本文探究将深度学习神经网络应用于蛋白质设计,以预测蛋白质中每个残基上 20 种天然氨基酸的几率,并且以网络输出为残基类型约束,顺利提高 Rosetta 工具设计三种天然蛋白质的平均序列一致性,同时相比早期方法,本研究以多层神经网络构建的方法在序列一致性方面提高了约 3% 的准确率,这些结果将推动计算蛋白质设计方法的进一步发展。
Jan, 2018
该研究提出了一种基于深度神经网络的蛋白质模型质量预测方法,利用少量输入特征和粗略模型描述以及数据库中已知蛋白质结构的迁移学习,达到了最先进的性能表现。
Apr, 2018
为了推动蛋白质的机器学习研究进展,我们介绍了一个开源数据集 OpenProteinSet,其中包含超过 1600 万个蛋白质多序列比对,与蛋白质数据库中的结构同源物和 AlphaFold2 蛋白质结构预测相对应,可广泛用于蛋白质结构、功能、设计以及大规模多模式机器学习研究的训练和验证数据。
Aug, 2023
该综述总结了近年来将深度学习技术应用于蛋白质结构建模及设计问题的最新进展,讨论了已经出现和需解决的挑战,针对该领域提出了许多有益的见解。
Jul, 2020
本研究基于一个大型数据库,通过开发学习模型 SASNet,改进了蛋白质相互作用预测的方法,证明了现有模型的性能不足以适用于大尺度数据,新模型展现出更好的性能。
Jul, 2018
本研究基于深度学习技术开发神经网络进行蛋白结构评分预测,仅使用三维原子密度数据,无需预定义的结构特征,并在 CASP7 到 CASP10 数据集上进行训练,测试结果表明该网络在多种蛋白质结构上具有良好的性能表现。
我们开发了一种基于注意力的图神经网络 (ContactNet),用于将从对接算法中得到的蛋白质相互作用模型分类为准确和错误的模型,不需要多序列比对,适用于其他类型的相互作用。
Jun, 2024
使用大规模的语言模型,可以从蛋白质序列中准确捕捉到进化信息,并在标记层和序列层任务中取得了显着的改进。
Aug, 2021
我们提出了一种新颖的结构感知的蛋白自监督学习方法,利用图神经网络模型预训练,从残基距离和二面角的角度考虑自监督学习任务,借鉴预训练蛋白语言模型的序列信息结合专门设计的 GNN 模型的结构信息进行伪二级优化,实验证明该方法在多个监督型下游任务中的有效性。
Apr, 2022
通过将远程同源检测集成到蛋白质语言模型中,我们实现了将结构信息融入蛋白质语言模型,从而在蛋白质功能预测任务中提高了功能注释准确性。
Feb, 2024