Jul, 2012

基于线性混合模型的大规模数据集高效计算及其在遗传研究中的应用

TL;DR考虑到基因组关联研究,在许多预测变量已经在同一个个体中收集并且每个预测变量都是单独分析的情况下,我们引入一个标准的线性模型,并在其中引入一个额外的随机效应。本文的三个创新点是(1)线性和 log-odds 尺度之间的转换是准确的,特别适用于小效应大小的重要的遗传情况;(2) 一种极大似然算法,比以前发表的方法快一个数量级以上;和 (3) 计算边缘似然的有效方法,允许贝叶斯模型比较。该方法已成功应用于包括超过 20,000 个人和 500,000 个遗传变异的多发性硬化的大规模关联研究。