Feb, 2024

SelectIT: 基于不确定性感知的选择性指导调整大型语言模型的方法

TL;DR使用 SelectIT 自动选择高质量的指令调优数据,并应用于选择性 Alpaca-GPT4 数据集,提高模型性能。