SIGIRJun, 2024

利用大型语言模型进行改写和聚合以最小化意图分类错误

TL;DR大型语言模型在自然语言生成方面取得了显著的成功,但在决策任务如分类方面的适用性却鲜有关注。本文提出了 PAG-LLM 方法,通过生成原始查询和多个并行查询的多次释义、多类别分类以及根据置信度得分对所有分类标签进行聚合,以解决大型多类别分类任务中的错误和词表外标签生成问题。我们在 CLINC 和 Banking 这两个大型多类别分类数据集上评估了 PAG-LLM,在错判率分别降低了 22.7% 和 15.1%。研究结果表明,PAG-LLM 在 LLM 不确定的复杂案例上表现出特别有效的作用,降低了重要的误分类和虚构标签生成错误。