微阵列,经验贝叶斯和双组模型
本文介绍了一种适用于计数时间序列数据的分层贝叶斯模型,能够轻松地考虑影响因素和在相关的时间序列数据组之间共享统计信息,并提出了一种高效的近似推理方法,并在供应链规划的多个数据集上进行了性能测试。
May, 2014
本文介绍了一种新颖的双向耦合聚类方法,用于基因芯片数据的分析:通过基于迭代聚类的算法,找到适合聚类的基因和样本的子集,从而发现在纯数据聚类时被掩盖和隐藏的新的数据分区和相关性;本方法被应用于两个基因芯片数据集,包括结肠癌和白血病数据集。
Apr, 2000
本文研究标准 Bayesian 变量选择先验在线性回归中的多重校正效应,澄清了 Bayesian 方法中的多重校正及 Ockham's-razor 的区别,同时通过实例、理论和模拟对比了经验 Bayes 和全 Bayes 方法。
Nov, 2010
本文提出了一种两阶段正则化方法,能够学习具有高预测性能的线性模型,产生几乎完美嵌套的基因列表以及适合进一步生物学研究,在合成和微阵列数据上的实验结果证实了该方法的有趣性质和潜在性。
Sep, 2008
提出了一种针对单细胞 RNA 测序随机解释基因表达水平的概率模型,其利用低维潜在表示、额外潜在变量和神经网络进行条件分布的建模,并利用方差推断和随机优化来拟合数据。此推断过程适用于 100 万个细胞以上的数据,且优于 ZIFA 和 ZINB-WaVE 方法。作者还将该框架扩展到批次效应和其他混淆因素,并提出了一种超越 DESeq2 方法的 Bayesian 假设检验,以分析基因差异表达。
Sep, 2017
提出了一种非参数贝叶斯因子分析(FA)的扩展,其中观察数据 𝐘 被建模为潜在无限个隐藏因素 𝐗 的线性叠加 𝐆,使用印度自助餐过程(IBP)作为先验来描绘稀疏性并允许推断潜在特征的数量,使用基于已知 E. Coli 稀疏连接矩阵的随机数据集以及三个逐渐复杂的生物数据集来研究该模型在基因表达数据建模中的实用性。
Nov, 2010