Feb, 2022

显微镜下的比例定律:从小尺度实验预测变形器的性能

TL;DR本文通过对自然语言处理任务的实证研究,发现神经比例定律不仅仅用于模型性能的预测,还可用于模型加速开发、优化模型选型以及模型的收敛调试等方面。