Apr, 2024

HLAT: 在AWS Trainium上高质量大型语言模型的预训练

TL;DR本论文展示了使用AWS Trainium和Neuron Distributed Training Library成功预训练了HLAT等具有高性能和高效性的最新大型语言模型。