Jul, 2024

多肽:多模态支持的语言-图学习肽性质

TL;DR通过将基于Transformer的语言模型与图神经网络相结合,本研究引入了一种创新的方法 Multi-Peptide 来预测肽的特性,结合了针对肽特性预测的Transformer模型 PeptideBERT 和 GNN 编码器,从而捕捉到序列和结构特征,并利用对比式语言-图像预训练(CLIP)将多模态嵌入对齐到一个共享潜空间,从而提高了模型的预测准确性。在溶血和非污染数据集的评估中,Multi-Peptide 显示出鲁棒性,达到了86.185% 的溶血预测准确率,突显了多模态学习在生物信息学中的潜力,为肽基研究和应用中的准确可靠预测铺平了道路。