IJCAIAug, 2023

用 ChatGPT 打破银行壁垒:金融领域的少样本文本分类

TL;DR我们提出使用对话式 GPT 模型,在金融领域利用 Banking77 数据集进行简单快速的少样本文本分类。我们的方法涉及 GPT-3.5 和 GPT-4 的上下文学习,最小化技术专业知识的要求,消除了昂贵的 GPU 计算需求,同时产生快速准确的结果。此外,我们使用 SetFit 这一最新的对比学习技术对其他预训练的屏蔽语言模型进行微调,以在完整数据和少样本设置下实现最先进的结果。我们的研究结果显示,即使样本较少,查询 GPT-3.5 和 GPT-4 的性能也能超过非生成模型的微调。然而,这些解决方案的订阅费用可能对小型机构来说过高。最后,我们发现生成模型在给定任务中表现更好,当显示人工专家选择的代表性样本,而不是随机选择的样本时。我们得出结论:a)我们提出的方法为具有有限标签可用性数据集中的少样本任务提供了实用的解决方案,并且 b)我们的最先进结果可以激发该领域的未来研究。