ACLMay, 2020

Span-ConveRT: 预训练对话表示的少样本对话片段抽取

TL;DR介绍了一个轻量级的模型 Span-ConveRT,用于对话槽填充,任务被视为基于轮的跨度提取。该模型通过与大型预训练对话模型(如 ConveRT)中编码的对话知识的简单集成,允许在少样本学习场景中取得一致的收益。此外,还发布了由真实餐厅预订对话编制的具有挑战性的新数据集 RESTAURANTS-8K,以激励更多的跨度提取对于槽填充任务的研究。