深度学习用于高效 GWAS 特征选择
本研究提出了一种创新的无监督特征选择框架 —— 分形自编码器 (FAE),它通过训练神经网络来精确定位全局取代能力和局部多样性的信息特征,具有显著优势,可在 14 个数据集上验证,特别是在基因表达数据探索方面可将测量成本降低约 15%,比现有的同类方法性能更优。
Oct, 2020
本文提出了一种利用自编码器和可解释的基于人工智能的评分来进行特征选择的算法,可用于诊断、预后和精准医疗。该算法在慢性淋巴细胞白血病数据集上应用,能够确定一组有意义的基因,供进一步医学研究参考。
Mar, 2023
使用高维临床数据和变分自编码器 (VAE) 学习的低维嵌入可用于基因组关联研究和多基因风险预测,而在基因关联研究中,FactorVAE 和 beta-VAE 相较于标准 VAE 或非变分自编码器在哮喘和慢性阻塞性肺疾病的全基因组显著位点数量、遗传度和多基因风险评分的性能上表现更好,而且 FactorVAE 在正则化超参数的多个值上效果显著,而 beta-VAE 对超参数的值非常敏感。
Jul, 2023
通过基因组范围关联研究(GWAS),我们介绍了一种名为 FCSNet 的新型 GWAS 特征选择机制,该机制通过基于遗传算法(GA)的多个独立特征选择运行构建网络,并利用非线性机器学习算法检测特征交互,进一步应用于结直肠癌 GWAS 数据集,解释了遗传异质性。
Aug, 2023
本文提出了一种名为 FsNet 的 DNN 基于非线性特征选择方法,针对高维度和小样本数据。实验结果显示,该方法在多个真实的生物数据集上表现出较高的有效性。
Jan, 2020
本文提出了一种新的自适应特征缩放方案用于大数据上的超高维特征选择,解决了激活大量特征时优化速度缓慢的问题,采用特征生成方法迭代激活一组特征并通过多重核学习子问题得到最优解,通过加速近端梯度算法在原始形式中求解多重核学习子问题并采用缓存技巧加速训练,通过大量论文实验验证了方法的竞争性能。
Sep, 2012
该研究使用神经网络结合自编码器提取特征的潜在空间,并利用生成对抗网络 GAN 生成合成样本,以解决医学数据集中的样本不平衡和高维数据降维的挑战,并在膀胱癌数据集和乳腺癌数据集上分别取得了 95.09% 和 88.82% 的准确度。
May, 2024
本文提出了一种扩展 Garson 算法的算法,用于解释基于自编码器的深度置信网络,并在文献中选取的分类和回归数据集上测试了该方法的有效性。
Jul, 2022
我们提出了一种深度序列生成学习方法来进行特征选择,该方法通过学习连续嵌入空间,将特征选择决策序列映射为与效用分数相关的嵌入向量,从而解决了传统方法中存在的离散搜索空间和专家特定超参数的问题。
Mar, 2024