May, 2023

基于交叉熵差异的场景内演示选择

TL;DR本研究提出了一个基于交叉熵差异的方法,用于选择上下文演示文稿以提高语言模型的性能。该方法基于该观察结果:在特定演示文稿上进行微调的语言模型在测试样例上的困惑度与上下文演示的有效性呈负相关。研究者评估了该方法在混合域数据集上的表现,并表明该方法可提高各种大型语言模型的性能。