Apr, 2024

捕捉蛋白质序列-结构-功能关系的蛋白质表示学习

TL;DR蛋白质表示学习旨在从蛋白质数据库中提取知识,以应用于各种蛋白质相关的下游任务,我们引入了新颖的不对称多模态掩码自编码器(AMMA),利用统一多模态编码器将蛋白质序列、结构和功能三种关键形态集成为统一的表示空间,通过不对称解码器确保序列潜在特征反映结构和功能信息,实验表明AMMA在学习展现良好间模态关系的蛋白质表示方面具有极高的效果,进而使其在各种蛋白质相关的下游任务中发挥作用。