Apr, 2025

阐明多模态蛋白质语言模型的设计空间

TL;DR本文研究了多模态蛋白质语言模型在蛋白质建模和设计中的局限性,特别是由于将3D结构切分为离散标记造成的细节和相关性损失。我们提出了一种改进的设计空间,包含更好的生成建模和结构感知架构,显著提升了652M模型的结构生成多样性和折叠能力,RMSD从5.52降低至2.36,超越了3B基线,接近专业折叠模型。