ProteinNet：用于蛋白质结构机器学习的标准化数据集

Feb, 2019

ProteinNet：用于蛋白质结构机器学习的标准化数据集

ProteinNet: a standardized data set for machine learning of protein structure

Mohammed AlQuraishi

TL;DR这篇研究论文介绍了一种名为 ProteinNet 的数据集，在蛋白质序列 - 结构关系的机器学习模型的训练和评估方面提供了一种标准化机制，并提出了一种方法来克服已有数据集中存在的一些挑战。

Abstract

Rapid progress in deep learning has spurred its application to bioinformatics problems including protein structure prediction and design.

deep learning bioinformatics machine learning protein structure protein sequence

发现论文，激发创造

深度学习神经网络在蛋白质计算设计中的应用

本文探究将深度学习神经网络应用于蛋白质设计，以预测蛋白质中每个残基上 20 种天然氨基酸的几率，并且以网络输出为残基类型约束，顺利提高 Rosetta 工具设计三种天然蛋白质的平均序列一致性，同时相比早期方法，本研究以多层神经网络构建的方法在序列一致性方面提高了约 3% 的准确率，这些结果将推动计算蛋白质设计方法的进一步发展。

Jan, 2018

蛋白质模型质量评估的深度迁移学习

该研究提出了一种基于深度神经网络的蛋白质模型质量预测方法，利用少量输入特征和粗略模型描述以及数据库中已知蛋白质结构的迁移学习，达到了最先进的性能表现。

Apr, 2018

OpenProteinSet: 大规模结构生物学训练数据

为了推动蛋白质的机器学习研究进展，我们介绍了一个开源数据集 OpenProteinSet，其中包含超过 1600 万个蛋白质多序列比对，与蛋白质数据库中的结构同源物和 AlphaFold2 蛋白质结构预测相对应，可广泛用于蛋白质结构、功能、设计以及大规模多模式机器学习研究的训练和验证数据。

Aug, 2023

蛋白结构建模与设计中的深度学习

该综述总结了近年来将深度学习技术应用于蛋白质结构建模及设计问题的最新进展，讨论了已经出现和需解决的挑战，针对该领域提出了许多有益的见解。

Jul, 2020

3D 蛋白结构端到端学习用于界面预测

本研究基于一个大型数据库，通过开发学习模型 SASNet，改进了蛋白质相互作用预测的方法，证明了现有模型的性能不足以适用于大尺度数据，新模型展现出更好的性能。