Feb, 2024

通过算法思维链条理解 LLM 训练数据中的噪音效应

TL;DR这篇论文研究了大型语言模型在预训练和微调过程中的噪声影响,通过引入可定制的有噪执行轨迹生成框架和定义静态噪声和动态噪声的方式,发现微调模型对高强度的静态噪声有很强的抗扰能力,但对低强度的动态噪声则表现较差,与此同时,少样本提示模型对静态噪声更为敏感。