ACLApr, 2022

使用现成大型语言模型进行意图分类的数据增强

TL;DR本研究提出了一种基于提示的方法,使用诸如 GPT-3 等预训练语言模型来生成带标签的意图分类的训练数据,与需要对数据生成进行任务特定的 LM 微调的方法相比,该方法不需要超参数调整,即使在训练数据非常缺乏的情况下也适用,并且评估结果表明,当考虑到的意图彼此足够不同时,GPT 生成的数据可以显著提高意图分类器的性能;而在半导体上的那些任务中,生成的数据的效果较差,原因是 GPT 经常生成错误的语句,而不是所需的语句。