May, 2024

GKT:一种面向高效云边协同 LLM 部署的基于导向的知识转移框架

TL;DR通过指导式知识迁移,我们引入了一种新颖而直观的框架来加速大型语言模型,在不断提高性能的同时保证了效率和实惠性。该框架能够无需微调,无需教师和学生模型具有相同的词汇,实现广泛的批量生成,且可轻松集成到各种模型中,同时在准确性和处理速度上实现了显著的提升。