Jul, 2024

通过检测和探索任务特定神经元,逐步理解 LLM 的多任务学习 (泛化)

TL;DR本文使用神经元的视角探讨大型语言模型中的多任务学习、泛化和持续学习问题,并提出基于神经元级别的连续微调方法。