May, 2023

SuperDialseg:一款大规模的用于有监督对话分段的数据集

TL;DR本文通过文件引导对话,并发布一个大规模的受监督数据集 SuperDialseg,该数据集包含基于两个流行的文件引导对话语料库的 9K 个对话。此外,我们提出了两个模型来利用对话特征,实现关于对话分割任务的表现,并提供包括 20 个模型在内的基准测试,并根据实证研究提供了一些洞见。我们相信我们的工作是对话分割领域向前迈出的重要一步。