Oct, 2023

量化语言模型对触发设计中伪特征的敏感性,或:我如何开始担忧触发格式

TL;DR大语言模型的关键因素在于提示设计对其性能会产生巨大影响,通过许多方面的分析研究,我们发现几种常用开源大语言模型对微妙的提示格式变化具有极高的敏感性,这种敏感性在不断增加模型大小、样本数量或进行指令调整时仍然存在。