Jan, 2023

预训练语言模型用于蛋白序列表示学习的重编程

TL;DR本文提出了一种通过 Representation Learning via Dictionary Learning(R2DL)框架,在少于一定训练样本的情况下对蛋白质序列进行嵌入,可以更好地进行蛋白质属性预测,并且可以比基于预先训练和标准监督方法的基线提高 $10^5$ 倍以上。