Oct, 2024

生成后精炼:零样本意图检测的数据增强

TL;DR本文研究了在零资源领域内进行意图检测的数据增强方法,解决了现有方法依赖有限标注示例的问题。作者提出了一种两阶段的方法,首先使用开源大型语言模型生成意图标签的表达,然后通过小型序列到序列模型进行精炼。研究表明,该方法在未见领域的数据利用率和多样性显著优于现有零样本基线。