BriefGPT.xyz
Feb, 2024
RECOST: 基于外部知识引导的数据高效训练指导优化
RECOST: External Knowledge Guided Data-efficient Instruction Tuning
HTML
PDF
Qi Zhang, Yiming Zhang, Haobo Wang, Junbo Zhao
TL;DR
使用外部知识与基于上下文的相对预测熵评估由大型语言模型合成的样本,并结合多样性一致性抽样,提出了一种名为RECOST的框架,通过在合成数据集中实验展示了方法的有效性,并仅使用全数据集的1%即可获得更好的结果。
Abstract
In the current landscape of
large language models
(LLMs), the process of
instruction tuning
serves as an essential step. Considering the high computing power overhead,
→