May, 2024

SynthesizRR: 利用检索增强生成多样化数据集

TL;DR通过检索和改进综合方法(SynthesizRR),我们通过扩展种子生成内容的方式来合成数据集,从而在语义和词汇多样性、与人类书写文本的相似性以及提纯效果方面极大地改善了标准 32-shot prompting 和其他六种基线方法。