Jul, 2023

DNAGPT: 适用于多个DNA序列分析任务的通用预训练工具

TL;DR我们提出了DNAGPT——一个基于超过9个物种的100亿个碱基对进行预训练的广义基础模型,它可以根据用户的任务要求设计提示,同时处理或输出DNA序列和数字。在分类、回归和生成任务上,我们的模型从预训练中受益,并因此可以使任何下游任务的性能提高。