Apr, 2024

通过多特性专业化引导大型语言模型进行零 - shot 作文评分

TL;DR借助 ChatGPT 将写作熟练度分解成不同特征,并生成每个特征的评分标准,然后利用大型语言模型在几轮对话中提取特征得分,并通过特征平均和最大最小缩放得出总体得分,实验证明 Multi Trait Specialization 在所有大型语言模型和数据集上始终优于直接提示 (Vanilla),同时在实际应用中,借助 MTS,小规模的 Llama2-13b-chat 显著优于 ChatGPT,实现有效的部署。