Jan, 2025

通过资源高效修剪从大型语言模型中推导特定编码子模型

TL;DR本研究解决了大型语言模型(LLMs)在编程任务中由于计算需求和资源要求高而限制其广泛应用的问题。文章提出了一种高效推导编程语言特定子模型的新方法,通过无结构修剪技术,并在多个领域测试不同的校准数据集对修剪效果的影响。研究表明,使用适当的校准数据集可以高效提取特定编程语言的子模型,同时保持与完整模型的可接受准确性,从而显著降低计算需求,增强LLMs在编程中的可及性。