Feb, 2024

RECOST: 基于外部知识引导的数据高效训练指导优化

TL;DR使用外部知识与基于上下文的相对预测熵评估由大型语言模型合成的样本,并结合多样性一致性抽样,提出了一种名为 RECOST 的框架,通过在合成数据集中实验展示了方法的有效性,并仅使用全数据集的 1%即可获得更好的结果。