Apr, 2024

提升深度学习性能的随机性技术研究

TL;DR本研究调查了各种随机化技术对深度神经网络 (DNNs) 的影响,发现添加噪音和随机掩码梯度更新等随机化方法有助于减少过拟合和增强泛化能力。使用粒子群优化器 (PSO) 进行超参数优化,对 MNIST、FASHION-MNIST、CIFAR10 和 CIFAR100 数据集的超过 30,000 个配置进行评估,结果显示数据增强和权重初始化的随机性是主要的性能因素。相关性分析表明不同的优化器偏好不同的随机化类型。GitHub 上提供了完整的实现和数据集。