深度模仿品

Nov, 2018

Deep Knockoffs

Yaniv Romano, Matteo Sesia, Emmanuel J. Candès

TL;DR使用深度生成模型对数据进行采样，生成对偶特征，提供一种灵活、无需模型的统计工具，以执行可控的变量选择和突变分析

Abstract

This paper introduces a machine for sampling approximate model-X knockoffs for arbitrary and unspecified data distributions using deep generative models. The main idea is to iteratively refine a knockoff sampling

deep generative models knockoff sampling model-free statistical tool variable selection mutation analysis

发现论文，激发创造

DeepDRK: 深度依赖规范化 Knockoff 用于特征选择

基于深度依赖正则化 knockoff 的模型在虚假发现率 (FDR) 控制方面表现优异，特别是在样本量较小且数据分布复杂的情况下，对合成数据、半合成数据和真实世界数据都取得了更好的性能。

Feb, 2024

针对大规模应用的模拟样本：具有假发现保证的新特征重要性统计量

该研究探讨了如何使用基于贝叶斯网络的有效算法来生成 knockoffs，并开发了新的测试统计量以提高功率。

Jul, 2018

用于 FDR 控制变量选择的自编码模拟生成器

本文提出了一种模型无关的 knockoff 生成器，该生成器通过潜在变量表示近似特征之间的相关性结构，进而达到了对 FDR 的控制和更好的功效，可以在 HIV-1 患者中找到与药物抗性相关的突变。

Sep, 2018

高维条件变量选择的 Model-X 仿制品

提出了一种新的 $model$-$X$ knockoffs 框架，可以在高维逻辑回归中有效地控制假发现率，甚至可以在条件分布完全未知的情况下实现控制变量选择，并且在研究英国克罗恩病的病例对照研究中，与原始分析相比可以发现两倍的结果。

Oct, 2016

利用 Knockoffs 寻找 Hidden Markov 模型中的基因

本文扩展了模型无关窃取的方法，介绍了一种有效的算法来对隐藏马尔可夫模型进行采样，并说明与选择性框架相结合，可应用于基因组关联研究，并应用于研究克罗恩病和胆固醇水平等连续表型。

Jun, 2017

基于误差的 Knockoffs 推断用于受控特征选择

提出了一种基于误差的模型 - X knockoff 推断方法，结合 knockoff 特征、基于误差的特征重要性统计量和 stepdown 过程，以应对高维数据下的特征选择，并在模型无需指定的情况下，能够控制误发现比例（FDP）、FDR 或 k-FWER 的理论保证。经验证明了该方法在模拟和实际数据上均具有竞争力的性能。

Mar, 2022

利用模型不变性的因果发现和 Knockoff 干预

通过对预测变量的干预利用模型不变性来推断非线性多变量时间序列系统中的因果关系，并借助 Knockoffs-based interventions 检测模型不变性。在真实数据和合成数据上评估我们的方法，我们的方法优于其他广泛使用的因果关系方法，如 VAR Granger 因果关系、VARLiNGAM 和 PCMCI+。

Jul, 2022

高维选择性推断的仿冒过滤器

本文提出了一种基于 knockoff filter 的测试框架，用于在特征数量可能远远超过观测单元数量的高维线性模型中控制伪发现率，并在基因组关联研究中展示了其性能。

Feb, 2016

最大偏离经验分布的保证最优生成建模

使用生成建模方法，本文提供了关于生成模型训练的理论洞察力，重点强调数据生成分布与训练数据生成分布之间的误差应随着样本量趋近无穷而趋近于零，并确保训练数据生成分布与任何复制训练数据样本的分布之间足够远。

Jul, 2023

利用模型 knockoffs 实现基于概念的图像分类器显著性解释

本研究提出了一种利用深度学习模型学习图像概念，然后使用 Knockoff 样本选择重要概念进行预测的方法来控制误发现率，实验结果表明该方法可以控制 FDR 并选择高度可解释的概念来提高模型的可靠性。

May, 2023