Apr, 2021

碳排放和大型神经网络训练

TL;DR通过计算 T5,Meena,GShard,Switch Transformer 和 GPT-3 等几种大型模型的能源使用和碳足迹,我们发现大而稀疏的深度神经网络可以比大而密集的深度神经网络使用更少的能量,并且具有可接受的准确性。在由于地理位置和专用数据中心基础架构带来的差异方面,对机器学习的能源效率进行度量是具有挑战性的,但我们相信通过明确计算能源消耗和碳足迹,并与开发人员合作,将能源使用作为关键指标来评估模型,可以帮助减少机器学习的碳足迹。