Dec, 2023

高维情况下的变量重要性需要分组

TL;DR解释机器学习算法的决策过程对模型性能提升和人类理解至关重要,通过评估单个变量的重要性来实现,甚至对于高容量的非线性方法,如深度神经网络(DNNs)。在高维设置中,引入了BCPI(基于块的条件排列重要性)作为一种新的通用框架来计算变量的重要性,具备统计保证并处理单个和群组情况。此外,通过将DNN架构扩展为适用于群组结构的次线性层,我们还引入了一种新的堆叠方法,以处理高基数群组,该方法在高度相关的群组中控制了一类错误,并在基准测试中展现了顶级准确性。此外,我们对大规模医学数据集进行了实际数据分析,旨在展示生物标志物预测方面的研究结果与文献的一致性。