Mar, 2024

监督学习问题的几何性质和稳定性

TL;DR我们引入了一种称为风险距离(Risk distance)的监督学习问题之间的距离概念,该概念能够促进稳定性结果;通过限定这些修改可以如何改变给定问题,我们可以量化采样偏差、噪声、有限数据和近似等问题的严重性。通过建立距离,我们探索了产生的监督学习问题空间的几何特征,提供了明确的测地线,并证明了分类问题集合在更大类别的问题中是稠密的。我们还提供了两个 Risk 距离的变种:一个在问题的预测者上加入指定权重的变种,另一个对问题的风险景观更为敏感。