May, 2023

估计大型语言模型能力的方法(无需标记测试数据)

TL;DR本文提出利用元模型,基于大型语言模型的置信度得分预测新任务的扩展学习(ICL)准确度,并在四个大型语言模型和三个任务集上对其进行了基准测试。