Mar, 2024

多尺度蛋白质语言模型用于统一分子建模

TL;DR通过在多尺度编码切换的蛋白质序列上进行预训练,并利用多尺度位置编码来捕捉残基和原子之间的关系,ms-ESM(多尺度 ESM)提出了一种新颖的方法,实现了多尺度统一的分子建模,实验结果表明,ms-ESM 在蛋白质 - 分子任务方面超过了以前的方法,展示了蛋白质语言模型的全部利用,进一步的研究发现,通过统一的分子建模,ms-ESM 不仅获得了分子知识,还保留了对蛋白质的理解。