深度学习用于高效 GWAS 特征选择

Dec, 2023

Deep Learning for Efficient GWAS Feature Selection

Kexuan Li

TL;DR在 GWAS 数据中，本研究引入了一种针对超高维数据的特征选择方法，该方法利用 Frobenius 范数惩罚增强学生网络的适应能力，通过自动编码器或监督自动编码器进行维度约简，以及经过正则化的前馈模型进行精确特征选择，在实验中展示了其在 GWAS 数据特征选择中的高效性和灵活性。

Abstract

genome-wide association studies (GWAS) face unique challenges in the era of big genomics data, particularly when dealing with ultra-high-dimensional datasets where the number of genetic features significantly exceeds the available samples. This paper introduces an extension to the

genome-wide association studies ultra-high-dimensional data feature selection frobenius norm penalty gwas data

发现论文，激发创造

分形自编码器用于特征选择

本研究提出了一种创新的无监督特征选择框架 —— 分形自编码器 (FAE)，它通过训练神经网络来精确定位全局取代能力和局部多样性的信息特征，具有显著优势，可在 14 个数据集上验证，特别是在基因表达数据探索方面可将测量成本降低约 15%，比现有的同类方法性能更优。

Oct, 2020

基于自编码器的无监督特征选择

本研究介绍了一种基于自编码器回归和组稀疏任务的无监督特征选择方法 AEFS，能够更灵活地选取高维数据中最重要的特征，实验结果表明该方法优于现有的方法。

Oct, 2017

基于深度学习与可解释人工智能的基因组特征选择新算法

本文提出了一种利用自编码器和可解释的基于人工智能的评分来进行特征选择的算法，可用于诊断、预后和精准医疗。该算法在慢性淋巴细胞白血病数据集上应用，能够确定一组有意义的基因，供进一步医学研究参考。

Mar, 2023

评估无监督解缠表示学习用于基因组发现和疾病风险预测

使用高维临床数据和变分自编码器 (VAE) 学习的低维嵌入可用于基因组关联研究和多基因风险预测，而在基因关联研究中，FactorVAE 和 beta-VAE 相较于标准 VAE 或非变分自编码器在哮喘和慢性阻塞性肺疾病的全基因组显著位点数量、遗传度和多基因风险评分的性能上表现更好，而且 FactorVAE 在正则化超参数的多个值上效果显著，而 beta-VAE 对超参数的值非常敏感。

Jul, 2023

基因异质性分析：利用遗传算法与网络科学

通过基因组范围关联研究（GWAS），我们介绍了一种名为 FCSNet 的新型 GWAS 特征选择机制，该机制通过基于遗传算法（GA）的多个独立特征选择运行构建网络，并利用非线性机器学习算法检测特征交互，进一步应用于结直肠癌 GWAS 数据集，解释了遗传异质性。

Aug, 2023

高维生物数据上的特征选择网络 FsNet

本文提出了一种名为 FsNet 的 DNN 基于非线性特征选择方法，针对高维度和小样本数据。实验结果显示，该方法在多个真实的生物数据集上表现出较高的有效性。

Jan, 2020

面向大数据的超高维特征选择

本文提出了一种新的自适应特征缩放方案用于大数据上的超高维特征选择，解决了激活大量特征时优化速度缓慢的问题，采用特征生成方法迭代激活一组特征并通过多重核学习子问题得到最优解，通过加速近端梯度算法在原始形式中求解多重核学习子问题并采用缓存技巧加速训练，通过大量论文实验验证了方法的竞争性能。

Sep, 2012

使用自编码器和生成对抗网络的方法处理多组学数据的不平衡类别和分类

该研究使用神经网络结合自编码器提取特征的潜在空间，并利用生成对抗网络 GAN 生成合成样本，以解决医学数据集中的样本不平衡和高维数据降维的挑战，并在膀胱癌数据集和乳腺癌数据集上分别取得了 95.09% 和 88.82% 的准确度。

May, 2024

基于新型扩展 Garson 算法的可解释深度置信网络自编码器

本文提出了一种扩展 Garson 算法的算法，用于解释基于自编码器的深度置信网络，并在文献中选取的分类和回归数据集上测试了该方法的有效性。

Jul, 2022

特征选择作为深度顺序生成学习

我们提出了一种深度序列生成学习方法来进行特征选择，该方法通过学习连续嵌入空间，将特征选择决策序列映射为与效用分数相关的嵌入向量，从而解决了传统方法中存在的离散搜索空间和专家特定超参数的问题。

Mar, 2024