Jun, 2023

扩展 MLPs: 归纳偏差的故事

TL;DR本研究重新探讨了深度学习最基本的构架之一 —— 多层感知机(MLP)在视觉任务中的性能极限,重点研究了不同规模下的预训练对于 MLP 性能的影响,揭示了缺乏归纳偏差时尺度扩展对于性能表现的提升。