May, 2023
SuperDialseg:一款大规模的用于有监督对话分段的数据集
SuperDialseg: A Large-scale Dataset for Supervised Dialogue Segmentation
TL;DR本文通过文件引导对话,并发布一个大规模的受监督数据集SuperDialseg,该数据集包含基于两个流行的文件引导对话语料库的9K个对话。此外,我们提出了两个模型来利用对话特征,实现关于对话分割任务的表现,并提供包括20个模型在内的基准测试,并根据实证研究提供了一些洞见。我们相信我们的工作是对话分割领域向前迈出的重要一步。