Feb, 2024

為什麼举得那麼重?通过削减层数减轻大型语言模型

TL;DR通过减少层数,可以缩小大型语言模型的规模,而仍能保持或提升其在文本分类任务中的性能水平。