Sep, 2023

对抗样本的可避免性:数据集中度在对抗鲁棒性中的作用

TL;DR现代机器学习分类器对于对抗性样本的易受攻击性已经引起了理论结果的关注,这些结果可能过于一般化以至于不适用于自然数据分布。本研究在理论上证明了数据分布的一个关键特性 —— 对输入空间的小体积子集的集中程度 —— 决定了是否存在健壮的分类器,并进一步证明,对于集中在低维线性子空间的联合上的数据分布,利用数据结构自然地导致享有良好健壮性保证的分类器,改进了某些方案的可证明认证方法。