COLINGSep, 2022

LINGUIST: 语言模型指令调整用于生成带有标注的话语,以用于意图分类和插槽标记

TL;DR本研究首次演示了使用大规模序列到序列 (seq2seq) 模型的指令微调来控制多语种意图和插槽标记数据生成输出的能力,并提出了 LINGUIST 方法,通过在 AlexaTM 5B 上微调实现对 Intent 分类和插槽标记 (IC+ST) 的注释数据生成。在各种实验数据集上对比了较先进的方法,结果表明在少样本(novel intent)和零样本(cross-lingual)条件下 LINGUIST 均显著优于当前技术水平的方法,实现了对多语种数据生成的高效控制。