蛋白结构建模与设计中的深度学习
本文探究将深度学习神经网络应用于蛋白质设计,以预测蛋白质中每个残基上 20 种天然氨基酸的几率,并且以网络输出为残基类型约束,顺利提高 Rosetta 工具设计三种天然蛋白质的平均序列一致性,同时相比早期方法,本研究以多层神经网络构建的方法在序列一致性方面提高了约 3% 的准确率,这些结果将推动计算蛋白质设计方法的进一步发展。
Jan, 2018
综述介绍了利用深度学习模型分析蛋白质相互作用的多样性方法,包括基于生物物理学知识的模型、表示学习、几何深度学习和生成模型,并指出了面临的挑战和新的研究方向。
Oct, 2023
本篇论文综述了近年来利用深度学习方法在蛋白质功能预测任务领域取得的良好表现,并介绍了现代最先进的深度学习模型对计算机视觉、自然语言处理和多模态学习等领域的重大贡献。同时,文章提出自动化蛋白质功能预测任务的重要性,并希望能够鼓励更多的研究者进行相关领域的探索。
Oct, 2022
深度学习在计算生物学中的历史、优势、挑战,以及应用于 DNA 序列分类、蛋白质结构预测等方面的前景进行了综述,强调了需要解决大规模标记数据集和深度学习模型可解释性等挑战以充分发挥其潜力,对于检测基因组变异、分析基因表达等方面带来了重要的转变,同时在表观遗传学数据分析和蛋白质结构预测方面也取得了显著进展,展望了深度学习在计算生物学中的未来前景。
Oct, 2023
该研究提出了一种基于深度神经网络的蛋白质模型质量预测方法,利用少量输入特征和粗略模型描述以及数据库中已知蛋白质结构的迁移学习,达到了最先进的性能表现。
Apr, 2018
本研究提出了一种基于表征学习的框架,将蛋白质序列映射到表示蛋白质结构信息的序列向量中,并通过双向 LSTM 模型和全局结构相似度以及单个蛋白质残基接触映射的反馈机制进行训练,实现了蛋白质序列在预测结构相似性方面的多任务学习,而且该方法在跨膜域预测方面也取得了优异的表现。
Feb, 2019
利用变分自编码器生成所需属性的蛋白质序列,不需要人为干预,可添加潜在的铜和钙结合位点并与隐马尔可夫模型进行比较,同时开发了蛋白质结构语法用来产生一种新型蛋白质拓扑结构。该模型能够限制蛋白质序列的搜索空间,易于扩展,有助于各种蛋白质设计任务。
Jun, 2018
综述了用于自动重建蛋白质结构的各种深度学习方法,分析了它们的影响,并讨论了为训练深度学习模型准备高质量数据集的挑战。未来,需要开发更先进的深度学习模型,能够有效地将冷冻电镜数据与其他补充数据源(如蛋白质序列和 AlphaFold 预测结构)相结合,以进一步推动领域的发展。
Sep, 2022