Apr, 2023

仅需提示和样本,使用 GPT-4 在低资源分类任务中进行数据增强

TL;DR本文通过简单的提示使用 GPT-4 和 ChatGPT 增强有限的标注语料库,用于三种不同的分类任务,在低资源环境中通过生成的合成样本,测试了两种扩充策略:一种是维护原始标签分布,另一种则是平衡分布,实验发现,合成数据有助于实现很好的下游任务效果和极少见类别的识别。