ACLMay, 2020
Span-ConveRT: 预训练对话表示的少样本对话片段抽取
Span-ConveRT: Few-shot Span Extraction for Dialog with Pretrained Conversational Representations
Sam Coope, Tyler Farghly, Daniela Gerz, Ivan Vulić, Matthew Henderson
TL;DR介绍了一个轻量级的模型 Span-ConveRT,用于对话槽填充,任务被视为基于轮的跨度提取。该模型通过与大型预训练对话模型(如 ConveRT)中编码的对话知识的简单集成,允许在少样本学习场景中取得一致的收益。此外,还发布了由真实餐厅预订对话编制的具有挑战性的新数据集 RESTAURANTS-8K,以激励更多的跨度提取对于槽填充任务的研究。