Dec, 2023

探索联系中心大型语言模型

TL;DR使用特定领域的指令对大型语言模型进行微调已被证明是提高其特定领域理解能力的有效方法。本研究通过评估联系中心领域指令微调的语言模型在对话、渠道和自动语音识别属性方面的显著特点,探索了不同架构、规模和微调范式下的性能,并发现与开箱即用的模型相比,联系中心微调的语言模型在领域下游任务中的应答可接受性提高了 48% 以上。此外,我们还比较了开箱即用模型和联系中心微调的模型在常用的 SentEval 数据集上的表现,并通过探测任务评估它们在表面、句法和语义信息方面的能力。有趣的是,我们发现探测分类器对一组探测任务的性能相对一致。这些观察结果表明,与开箱即用的模型相比,联系中心微调的语言模型在编码表面、句法和语义属性方面的依赖较少,突显了特定领域自适应和探测任务性能之间错综复杂的相互作用,为在专业环境中探索微调语言模型的行为提供了机会。