Nov, 2023

干净评估:对受污染的大型语言模型的清洁评估

TL;DR为了解决大型语言模型中的数据污染和评估问题,我们提出了一种名为 Clean-Eval 的方法,利用语义检测器筛选出生成的低质量样本,从候选集中选择出与原始污染数据在语义上相似但表达不同的最佳候选来形成一个新的基准,从而在少样本学习和微调场景下还原了受污染的语言模型的实际评估结果。