Oct, 2023

深度学习的微调数据格式

TL;DR窄位宽数据格式是降低现代深度学习应用的计算和存储成本的关键。本文评估了使用分区缩放因子和狭窄的浮点和整数类型结合的微标度(MX)数据格式。MX 格式平衡了硬件效率、模型准确度和用户摩擦之间的竞争需求。超过两打基准实验证明了 MX 数据格式作为 AI 推理和训练中替代 FP32 的易用性低的替代品的实用性。我们还展示了在最小准确度损失和无需调整训练配方的情况下,首次实现对生成语言模型进行低于 8 位权重、激活和梯度的训练。