Oct, 2023

定量性状的遗传预测:以身高为例的机器学习指南

TL;DR机器学习和深度学习在生物问题中取得了许多成功,尤其在蛋白质折叠领域。然而,从基因组中预测复杂性状的问题却受到机器学习界的相对较少关注。本文提供了对目前最先进模型和与其开发相关细微问题的机器学习界概述,以作为预测表型的新模型开发时需要考虑的参考,其中以身高作为连续值表型的例子给出了基准数据集、混杂因素、特征选择和常用评估指标的介绍。