Oct, 2024
逐层揭示指令调优的大型语言模型中的多任务学习发生位置
Layer by Layer: Uncovering Where Multi-Task Learning Happens in
Instruction-Tuned Large Language Models
TL;DR本研究解决了预训练大型语言模型在多任务学习中保持任务特定知识的程度与位置尚未明确的问题。通过矩阵分析工具,本研究发现指令调优显著影响模型的任务表示,并识别了模型从高层次通用表示转向更具任务导向表示的具体层次。这一发现丰富了我们对大型语言模型机制的理解,并为参数高效转移学习和多任务学习的未来研究奠定了基础。