Aug, 2023

利用深层 ReLU 网络对高斯混合模型生成的数据进行分类

TL;DR该研究使用深度 ReLU 神经网络对由 Gaussian Mixture Models (GMMs) 在 $R^d$ 下生成的无界数据进行二元分类,并首次获得了无需限制模型参数的分类的非渐进上界和收敛速度的超额风险 (超额误分类误差)。所得到的收敛速度不依赖于维度 d,表明深度 ReLU 网络能够克服在分类中的维度困境。通过利用高斯分布的解析性和快速衰减,我们考虑了一个无界域,以改善现有分类算法的泛化分析,为一般解析函数使用 ReLU 网络提供了新颖的近似误差界限,这对研究人员可能具有独立的兴趣。高斯分布很好地适用于建模应用中产生的数据,例如语音、图像和文本;我们的结果在实际分类问题中为深度神经网络的效率提供了理论验证。