Feb, 2024

FoldToken: 通过向量量化及更多方式学习蛋白质语言

TL;DR通过引入FoldTokenizer和SoftCVQ等创新性方法,本研究在蛋白质序列-结构描述方面取得了突破性进展,将蛋白质序列与结构转化成统一的模态,构建了首个用于序列-结构共同生成的GPT风格模型FoldGPT,并在蛋白质背骨填充和抗体设计任务中取得了有希望的结果。