protein representation learning is a challenging task that aims to capture
the structure and function of proteins from their amino acid sequences.
Previous methods largely ignored the fact that not all amino acid
蛋白质表示学习旨在从蛋白质数据库中提取知识,以应用于各种蛋白质相关的下游任务,我们引入了新颖的不对称多模态掩码自编码器(AMMA),利用统一多模态编码器将蛋白质序列、结构和功能三种关键形态集成为统一的表示空间,通过不对称解码器确保序列潜在特征反映结构和功能信息,实验表明 AMMA 在学习展现良好间模态关系的蛋白质表示方面具有极高的效果,进而使其在各种蛋白质相关的下游任务中发挥作用。