Jul, 2023

Prot2Text: GNNs 与 Transformers 实现的多模态蛋白质功能生成

TL;DR使用图神经网络和大型语言模型在编码器 - 解码器框架中,本研究提出了一种新颖的方法 Prot2Text,以自由文本形式预测蛋白质的功能,超越传统的二分类或多分类任务,该多模态方法综合蛋白质序列、结构和文本注释等多种数据类型,实现了对蛋白质功能的整体表示,提供了详细准确的描述,通过从 SwissProt 中提取多模态蛋白质数据集对模型进行评估,结果表明了多模态模型的转变性影响,特别是图神经网络和大型语言模型的融合,为研究人员提供了更准确预测蛋白质功能的强大工具,代码、模型和演示将公开发布。