Oct, 2023

大型语言模型在新型人工智能加速器上的全面性能研究

TL;DR研究了大型语言模型在多个人工智能加速器和图形处理器上的性能特性,并评估了这些模型的性能,考虑到序列长度、扩展行为、稀疏性和梯度积累步骤的敏感性。