通过融合基于序列和图形编码的深度学习方法,本研究提出了一种名为 RepCon 的肽共建模方法,用于提高鉴别性能。实验证明,RepCon 方法在共建模框架下的优越性以及在模型解释方面的有效性。
Oct, 2023
利用深度学习技术,本文提出了 PepGB 和 diPepGB 两个深度学习框架,用于预测肽蛋白相互作用关系,以促进肽类早期药物发现,提高目标识别和化合物发现过程中的效率。
Jan, 2024
通过训练两个自回归模型和四个自编码器模型,使用生物信息数据培训出来的语言模型(Language Models)能够在低推断开销下完成新的前沿预测,例如使用蛋白 LM - 嵌入 (ProtT5) 能够在无需使用进化信息的情况下,成功地进行氨基酸序列每残基预测,并出现在这个 https URL。
Jul, 2020
本文提出了一种利用图神经网络和自然语言大模型生成结构和序列感知型蛋白质表示的新框架,并将其与传统的基于结构对齐的方法相比较,证明了该方法在比较蛋白质结构和蛋白质结构分类任务中的优越性能。
Jun, 2023
利用生成型神经网络学习药物靶标蛋白结构的结构集合,以便于更好的理解药物机理和发展治疗方法,同时通过蛋白几何自编码器模型在蛋白质的内在和外在几何学上进行分离编码,快速生成蛋白质构象的方案。
May, 2022
利用基于语言模型的灵活深度学习策略,基于一个完全基于提示的模型,将 transformer 和图卷积架构集成到因果多头图机制中,实现一个生成预训练模型,用于预测蛋白质的二级结构内容、蛋白质可溶性和蛋白质测序等任务,并可用于设计具有这些特性的蛋白质,这个模型展现了多任务和协同作用的应用价值。
May, 2023
本研究介绍了一种使用深度神经网络从氨基酸和 SMILES 序列中提取局部化学上下文并从药物中提取分子结构的端到端学习框架 DeepGS,并使用先进的嵌入技术 Smi2Vec 和 Prot2Vec 对象进行符号数据处理,相比 KronRLS、SimBoost、DeepDTA 和 DeepCPI 等现有模型,实验结果显示出 DeepGS 的优越性和竞争力。
Mar, 2020
MMDesign 是一个结合了先前结构模块和语境模块的预训练模型的新型蛋白质设计范式,利用自编码器(AE)语言模型将蛋白质序列的先验语义知识纳入其中,并引入了一种跨层跨模态对齐算法来确保结构模块学习到长期时间信息并保持结构和语境模态的一致性,在仅使用小规模 CATH 数据集进行训练的实验结果表明,我们的 MMDesign 框架在各种公共测试集上始终优于其他基线方法,并提出了系统性定量分析技术来评估生成的蛋白质序列和数据分布的生物可能性,以展示其可解释性并揭示蛋白质设计的规律。
Dec, 2023
我们提出了一种新颖的结构感知的蛋白自监督学习方法,利用图神经网络模型预训练,从残基距离和二面角的角度考虑自监督学习任务,借鉴预训练蛋白语言模型的序列信息结合专门设计的 GNN 模型的结构信息进行伪二级优化,实验证明该方法在多个监督型下游任务中的有效性。
Apr, 2022
本研究通过深度学习技术,使卷积神经网络适应蛋白二级结构预测问题,达到了 70%的准确度,并尝试使用序列到序列学习和集合策略进一步提高精确度。
Nov, 2016