ICMLJul, 2023

ProtiGeno: 一种使用蛋白质语言模型的原核生物短基因发现器

TL;DRProtiGeno 是一种基于深度学习的方法,专门用于预测短的原核生物基因,它使用了数百万个进化蛋白质训练的蛋白质语言模型,在对 4,288 个原核生物基因组进行系统性的大规模实验证明,ProtiGeno 比当前最先进的基因发现工具更准确地预测了短的编码和非编码基因。