AAAIMar, 2021

NaturalConv:一个面向多轮主题驱动会话的中文对话数据集

TL;DR本文介绍一个主题驱动的多轮中文对话数据集 ——NaturalConv,提供了包含六个领域的 19,900 个对话和 400,000 个发言,可用于多轮对话系统研究的基准测试,同时为该数据集提供了一些基准模型的结果,并表明引入背景知识 / 主题并不能显著提高模型的性能。