Feb, 2024

用于低资源领域任务的检索增强数据增强

TL;DR提出了一种新的方法,通过将其他数据集中的丰富示例与给定的训练数据结合起来,通过在原始和检索的样本之间的上下文信息中促使大型语言模型生成新的样本,以增加训练数据的多样性和相关性,在低资源环境中实现了比现有大型语言模型数据增强基线更好的性能。