BriefGPT.xyz
Ask
alpha
关键词
datacenter infrastructure
搜索结果 - 1
碳排放和大型神经网络训练
通过计算 T5,Meena,GShard,Switch Transformer 和 GPT-3 等几种大型模型的能源使用和碳足迹,我们发现大而稀疏的深度神经网络可以比大而密集的深度神经网络使用更少的能量,并且具有可接受的准确性。在由于地理位
→
PDF
3 years ago
Prev
Next