Aug, 2023

RecycleGPT:一种带可循环模块的自回归语言模型

TL;DR利用预先生成的模型状态进行回收,RecycleGPT 是一种生成式语言模型,具有快速解码速度,通过理论评估和实际测试,在保持高性能的同时实现了 1.4 倍加速,降低了推理延迟。