May, 2024

数据解释性和特征选择的部分信息分解

TL;DR本文介绍了 Partial Information Decomposition of Features(PIDF),一种同时实现数据可解释性和特征选择的新范式。相较于传统方法,我们的方法基于每个特征的三个度量值:与目标变量的相互信息、特征对协同信息的贡献以及冗余信息的数量。我们根据这三个度量值开发了一种新的程序,不仅揭示了特征与目标的相关性,还考虑了特征与其他特征的组合所提供的额外和重叠信息。我们广泛评估了 PIDF,使用了合成和真实数据,并通过遗传学和神经科学领域的案例研究展示了其潜在应用和有效性。