Oct, 2023

基于注意力的多任务学习用于基因编写器结果预测

TL;DR人类遗传疾病常常源于点突变,因此需要精确的基因组编辑技术。其中,碱基编辑作为一种使单个核苷酸发生靶向变化的技术显著突出。然而,其临床应用受到编辑效率低和非预期变异的限制,需要在实验室大量试错实验来加快该过程。为了加速这一过程,我们提出了一种基于注意力机制的两阶段机器学习模型,用于预测给定基因组目标序列的所有可能编辑结果的概率。我们进一步提出了一种多任务学习的模式,能够同时学习多个碱基编辑器(即变体)。我们模型的预测与多个数据集和碱基编辑器变体的实际实验结果能够保持强相关性。这些结果进一步验证了模型改进和加速碱基编辑设计过程的能力。