Dec, 2023

无偏的、通用的、高灵敏度的信号肽预测器与深度蛋白质语言模型

TL;DR用计算方法准确识别信号肽,尤其对于元基因组数据分析,提出了一种基于蛋白质语言模型的信号肽分类和切割位点预测的深度学习方法,并应用标签分布感知边界损失处理数据不平衡问题,并利用蛋白质的进化信息丰富表示来克服物种信息依赖。