Mar, 2023

Transformer 是否能预测不同 ImageNet 模型的参数?

TL;DR在机器学习领域,使用大数据集对神经网络进行预训练已成为众多社群才能实现的基石之一,本文旨在实现预训练的民主化,并训练并发布出一种能够预测其他神经网络高质量 ImageNet 参数的单一神经网络,通过使用预测参数作为初始化,我们能够提高在 PyTorch 可用的不同 ImageNet 模型的训练效果.