Jun, 2024

SUBLLM:LLM 的一种新型高效架构及令牌序列子采样

TL;DR通过提出 SUBLLM 架构,本文解决了大型语言模型中训练和推断的效率问题,通过引入子采样、上采样和旁路模块,SUBLLM 在训练和推断速度以及内存使用方面取得了显著的改进。