Jun, 2024

Nemotron-4 340B 技术报告

TL;DR我们发布了 Nemotron-4 340B 系列模型,包括 Nemotron-4-340B-Base、Nemotron-4-340B-Instruct 和 Nemotron-4-340B-Reward。这些模型是在 NVIDIA 开放模型许可协议下提供的,允许分发、修改和使用模型及其输出。我们的模型在广泛的评估基准上表现出与开放模型相当的竞争力,并在单个 DGX H100(8 个 GPU)中以 FP8 精度部署。我们相信社区可以在各种研究和商业应用中受益于这些模型,特别是用于生成合成数据以训练较小的语言模型。值得注意的是,我们模型对齐过程中超过 98% 的数据是合成生成的,这显示了这些模型在生成合成数据方面的效果。为了进一步支持开放研究并促进模型开发,我们还开源了在我们的模型对齐过程中使用的合成数据生成流程。