May, 2023

尺度量化的有趣特性

TL;DR本研究探究量化在模型表现中的权衡是否是一种新兴特性 (emergent property),除了提出优化量化友好的训练方式可以降低表现退化的维度,我们的实验还表明异常维度不是规模的一个内在产物而是敏感于预训练时的优化条件,这一结论为更高效的量化和其它新兴特性的探究提供了可能性。