深度模仿品
基于深度依赖正则化 knockoff 的模型在虚假发现率 (FDR) 控制方面表现优异,特别是在样本量较小且数据分布复杂的情况下,对合成数据、半合成数据和真实世界数据都取得了更好的性能。
Feb, 2024
本文提出了一种模型无关的 knockoff 生成器,该生成器通过潜在变量表示近似特征之间的相关性结构,进而达到了对 FDR 的控制和更好的功效,可以在 HIV-1 患者中找到与药物抗性相关的突变。
Sep, 2018
提出了一种新的 $model$-$X$ knockoffs 框架,可以在高维逻辑回归中有效地控制假发现率,甚至可以在条件分布完全未知的情况下实现控制变量选择,并且在研究英国克罗恩病的病例对照研究中,与原始分析相比可以发现两倍的结果。
Oct, 2016
本文扩展了模型无关窃取的方法,介绍了一种有效的算法来对隐藏马尔可夫模型进行采样,并说明与选择性框架相结合,可应用于基因组关联研究,并应用于研究克罗恩病和胆固醇水平等连续表型。
Jun, 2017
提出了一种基于误差的模型 - X knockoff 推断方法,结合 knockoff 特征、基于误差的特征重要性统计量和 stepdown 过程,以应对高维数据下的特征选择,并在模型无需指定的情况下,能够控制误发现比例(FDP)、FDR 或 k-FWER 的理论保证。经验证明了该方法在模拟和实际数据上均具有竞争力的性能。
Mar, 2022
通过对预测变量的干预利用模型不变性来推断非线性多变量时间序列系统中的因果关系,并借助 Knockoffs-based interventions 检测模型不变性。在真实数据和合成数据上评估我们的方法,我们的方法优于其他广泛使用的因果关系方法,如 VAR Granger 因果关系、VARLiNGAM 和 PCMCI+。
Jul, 2022
本文提出了一种基于 knockoff filter 的测试框架,用于在特征数量可能远远超过观测单元数量的高维线性模型中控制伪发现率,并在基因组关联研究中展示了其性能。
Feb, 2016
使用生成建模方法,本文提供了关于生成模型训练的理论洞察力,重点强调数据生成分布与训练数据生成分布之间的误差应随着样本量趋近无穷而趋近于零,并确保训练数据生成分布与任何复制训练数据样本的分布之间足够远。
Jul, 2023
本研究提出了一种利用深度学习模型学习图像概念,然后使用 Knockoff 样本选择重要概念进行预测的方法来控制误发现率,实验结果表明该方法可以控制 FDR 并选择高度可解释的概念来提高模型的可靠性。
May, 2023