Feb, 2024

有限预算下快速学习的最佳臂识别

TL;DR在大型语言模型中,显著的指导遵循能力引发了对自动学习合适提示的日益关注。本研究通过在提示学习中显式引入有限预算约束,提出了一种统一的框架TRIPLE(用于提示学习的最佳臂识别),并通过利用聚类和函数逼近的思想对其进行了两种基于嵌入的增强。广泛的实验表明,TRIPLE在满足有限预算限制的同时,相对于之前的基线方法在多个任务上都取得了显著的性能提升。