Dec, 2023

Mini-GPTs: 基于上下文剪枝的高效大型语言模型

TL;DR利用上下文剪枝技术开发 Mini-GPT 来优化大型语言模型(LLMs),通过对传统 LLMs 的计算架构进行剪枝,保留核心功能同时大幅减小模型大小,此方法在多样且复杂的数据集上展现了高效性和有效性,作为构建领域特定 LLMs 的潜力方法,是未来发展的基石。