Oct, 2023

学习为未见图像数据生成 ConvNets 的参数

TL;DR传统的卷积神经网络依赖于大量的图像数据,并使用迭代优化算法来学习网络参数,这使得训练非常耗时和资源密集。本文提出了一种新的训练范式,将卷积神经网络的参数学习形式化为一种预测任务,通过学习数据集与网络参数之间的超映射关系,来直接预测在训练阶段从未见过的图像数据的网络参数。这种基于超网络的模型称为 PudNet,通过共享权重的自适应超循环单元捕捉不同网络层之间的参数依赖关系。实验证明,我们提出的方法在两种设置下(数据集内预测和数据集间预测)对于未见过的图像数据集具有良好的效果。PudNet 还可以很好地应用于大规模数据集,例如 ImageNet-1K。训练 ResNet-18 使用 GC 从头开始,在 ImageNet-1K 上花费 8967 个 GPU 秒,并获得 44.65% 的前 5 准确率。然而,我们的 PudNet 仅花费 3.89 个 GPU 秒来预测 ResNet-18 的网络参数,达到相当的性能(44.92%),比传统训练范式快了超过 2300 倍。