单细胞 RNA 测序在过去十年中的指数级扩展
利用多模式单细胞技术,通过整合不同数据类型并建模模态之间的相互关系,为疾病生物标志物检测和药物发现提供了改进,实验结果表明机器学习技术对于建模细胞发展中 DNA 到 RNA 及蛋白质之间的协变性具有显著效果,有望推动对细胞分化和功能的理解并发挥机器学习的潜能。
Nov, 2023
提出了一种基于扩散模型的全新方法 Single-Cell Latent Diffusion (SCLD),可以在一个统一的框架内合成大规模、高质量的单细胞 RNA 测序样本,包括整体和特定的细胞亚群,实验结果显示了其在细胞分类和数据分布距离方面的最先进性能以及合成特定细胞亚群的能力。
Dec, 2023
使用 ChatGPT 等大型语言模型进行单细胞数据注释是一种有效的方法,能够揭示在之前被忽视的细胞亚型特异性分化路线和关键的生物学问题,特别是在癌症进展、哺乳动物发育和干细胞分化方面的应用前景非常广阔,是单细胞分析领域的重要里程碑。
Apr, 2023
单细胞组学的高维数据与生物学系统的复杂性共同构成了因果关系的挑战,本研究旨在应用机器学习方法解决这一问题,讨论了单细胞基因组学中因果推断方法的应用、相关的假设、存在的问题以及未来的研究方向,并预测因果模型将成为未来实验设计的重要工具。
Oct, 2023
提出了一种针对单细胞 RNA 测序随机解释基因表达水平的概率模型,其利用低维潜在表示、额外潜在变量和神经网络进行条件分布的建模,并利用方差推断和随机优化来拟合数据。此推断过程适用于 100 万个细胞以上的数据,且优于 ZIFA 和 ZINB-WaVE 方法。作者还将该框架扩展到批次效应和其他混淆因素,并提出了一种超越 DESeq2 方法的 Bayesian 假设检验,以分析基因差异表达。
Sep, 2017
该研究探讨了如何训练和适应大型语言模型,以解释和区分单细胞 RNA 测序数据中的细胞类型,初步研究结果表明这些基础模型在准确分类已知细胞类型方面表现出色,展示了大型语言模型作为发现新生物学见解的有效工具的潜力。
Feb, 2024
本研究使用 scDiffusion 模型基于扩散过程生成具有可控条件的高质量单细胞 RNA 测序数据,并展示其能够产生接近真实数据的单细胞基因表达数据,超过现有模型在多个度量指标上的性能,对罕见细胞类型等特定细胞类型进行条件生成,并通过梯度插值生成小鼠胚胎细胞的连续发育轨迹,以此证明 scDiffusion 是增强真实 scRNA-seq 数据和深入研究细胞命运的强大工具。
Jan, 2024
通过使用概率机器学习方法,将细胞的遗传表达信息和细胞在组织样本中的空间坐标映射到一个联合潜变量空间中,可以获得完整的遗传表达和空间信息,从而更好地理解细胞过程和通路。
Nov, 2023
近期单细胞基因组学的新进展要求在基因面板选择上精确以有效解读复杂的生物学数据。我们提出了一种迭代的基因面板选择策略,该策略能够整合其他基因选择算法的结果,并引入强化学习中的探索过程,以提高我们的框架的效率并动态地精细调整和定位基因面板选择。
Jun, 2024