May, 2023

基于LLM的数据增强方法提升跨语言表现

TL;DR本研究探讨了利用大型语言模型进行数据增强在跨语言常识推理数据集中的潜力,通过使用包括Dolly-v2、StableVicuna、ChatGPT和GPT-4在内的大型语言模型来扩充三个数据集,确定了该方法的有效性,并比较了使用英语生成数据和将英语生成的数据翻译成目标语言。实验结果表明,使用GPT-4生成的合成数据进行训练的性能比其他模型优秀,ChatGPT和GPT-4在大多数语言中生成的自然文本效果非常好,但在某些情况下,它们的效益会下降。