Mar, 2024

DPPA: 大型语言模型的修剪方法以模拟合并

TL;DR通过提出动态修剪分区增强(DPPA)的双阶段方法,本文解决了合并复杂精调模型的挑战,该方法将动态修剪和动态分割放大两种策略相结合,实验结果表明,该方法在保留少于 20% 的特定领域参数的同时,表现与保留 90% 参数的其他方法相媲美,并且在模型合并中表现优异,性能提升将近 20%。