Jul, 2023

TransNormer 模型参数适配至 1750 亿

TL;DR我们提出了 TransNormerLLM,这是第一个基于线性注意力的大型语言模型(LLM),在准确性和效率方面均超过了传统的基于 softmax 注意力的模型。