Feb, 2024

训练的随机森林完全揭示您的数据集

TL;DR我们介绍了一种基于优化的重建攻击,能够完全或近乎完全重建用于训练随机森林的数据集。我们将重建问题定义为一个组合优化问题,并通过最大似然目标函数来解决。通过广泛的计算研究,我们证明了即使在小规模树集的情况下,使用特征随机化的随机森林也容易被完全重建,这突显了广泛采用的集成方法固有的关键弱点,值得关注和缓解。虽然隐私研究中已经讨论了此类重建攻击的潜在性,但我们的研究提供了明确的实证证据。