Nov, 2023

使用词汇缩减的大型语言模型推理

TL;DR大型语言模型的推理对计算和内存要求较高,因此我们通过词汇筛选改进了其性能,可以显著减少内存使用并提高生成速度。然而,我们也发现了此类词汇选择方法的局限性,并提出了未来研究的方向。