Oct, 2023

相对内在维度与学习的内在性

TL;DR高维数据具有令人惊讶的特性:仅使用简单的线性分类器就可以高概率地将数据点配对分开,甚至从任意子集中分离出来。我们引入了数据分布的内在维度的新概念,精确地捕捉了数据的可分离性质。对于这个内在维度,以上的经验法则成为一条规律:高内在维度保证了数据的高可分离性。我们将这个概念扩展为两个数据分布的相对内在维度,并证明它提供了成功学习和推广二元分类问题的概率的上下界。