从微阵列数据选择嵌套相关基因群的规范化方法

Sep, 2008

从微阵列数据选择嵌套相关基因群的规范化方法

A Regularized Method for Selecting Nested Groups of Relevant Genes from Microarray Data

Christine De Mol, Sofia Mosci, Magali Traskine, Alessandro Verri

TL;DR本文提出了一种两阶段正则化方法，能够学习具有高预测性能的线性模型，产生几乎完美嵌套的基因列表以及适合进一步生物学研究，在合成和微阵列数据上的实验结果证实了该方法的有趣性质和潜在性。

Abstract

gene expression analysis aims at identifying the genes able to accurately predict biological parameters like, for example, disease subtyping or progression. While accurate prediction can be achieved by means of many different techniques, →

gene expression analysis gene identification regularization method linear models biological investigations

发现论文，激发创造

基于统计和机器学习方法的基因表达谱分析的比较分析

机器学习模型在表达基因数据的表型分类方面取得了好的性能，通过提取决策的解释，这些模型能提供对表型的理解，讨论了这种解释的生物学和方法论限制，并在癌症和健康组织样本的多个数据库上进行了实验。

Feb, 2024

基因微阵列数据的双向聚类分析

本文介绍了一种新颖的双向耦合聚类方法，用于基因芯片数据的分析：通过基于迭代聚类的算法，找到适合聚类的基因和样本的子集，从而发现在纯数据聚类时被掩盖和隐藏的新的数据分区和相关性；本方法被应用于两个基因芯片数据集，包括结肠癌和白血病数据集。

Apr, 2000

基于正则化的多元回归用于鉴定乳腺癌整合基因组学研究中的主预测因子

提出了一种新的方法 remMap-- 用于在高维低样本大小的情况下拟合多元响应回归模型的正则化多元回归方法，它的目的是基于多种类型的高维基因组数据研究不同生物分子之间的调节关系。该方法不仅可以有效解决高维问题，而且可以考虑网络建模和基因变异等问题。通过大量的模拟研究和应用于乳腺癌数据的实证研究，可以发现 remMap 方法可以鉴别出影响多个基因 RNA 表达水平的 DNA 复制数变化的热点区域，从而更好地理解乳腺癌的病理学。

Dec, 2008

基因表达数据分析的计算学习方法综述

本综述介绍了基因表达分析中使用的各种统计和计算工具，以及在数据预处理和分析方面如数据归一化、特征选择和分类等方面的方法和技术，并重点讨论了这些工具的应用。

Feb, 2022

DeepCancer：基于深度生成式学习通过基因表达检测癌症

该研究提出了一种深度生成式机器学习架构（称为 DeepCancer），通过对未标记的微阵列数据进行特征学习，帮助对癌症进行诊断。该模型在两个不同的临床数据集上进行了测试，并证明了其精确度较高，可显著控制假阳性和假阴性评分。

Dec, 2016

一个单细胞基因表达语言模型

提出了 Exceiver 模型，使用同一自我监督任务来处理单细胞 RNA 表达数据，学习基因之间的上下文依赖关系，并证明该模型具有迁移学习能力。

Oct, 2022

基于深度学习模型的模糊基因选择和癌症分类

通过应用模糊基因选择技术，本研究提出了一个新的肿瘤分类模型，优于标准 MLP 方法，并在生物医学科学领域中提高了基因表达数据的分类准确性。

May, 2023

基因调控关系的大规模局部因果推断

提出了一种基于 Bayesian 方法的计算模型，用于从基因表达的高通量遗传数据中发现基因之间的局部因果关系。模型的应用结果表明，可以从稳定且保守的局部因果结构后验概率中推导出最有意义的调控关系。

Sep, 2019

基于自适应 K 近邻的多目标 PSO 微阵列表达数据基因选择

本研究提出了一种新的方法，使用基因表达数据进行癌症分类问题的解决，首先运用信噪比算法筛选出非冗余基因的子集，然后运用多目标粒子群算法进行特征选择，并采用自适应 K 最近邻算法进行癌症分类，从而提高了癌症分类的准确性。

May, 2022

多变量回归方法在定量性状网络关联分析中的应用

该研究提出了一种名为图引导融合套索（GFlasso）的新的统计框架，通过将量化特征的相关性结构表示为网络，并利用该特征网络在基因型和特征上编码结构正则化，以便高灵敏度和特异性地检测共同影响高度相关特征子组的遗传标记。

Nov, 2008