Dec, 2023

S2M:用于对话式问答的单轮转多轮数据集转换

TL;DR提供数据增强给会话问答系统 (CQA) 可以有效提高模型性能。然而,由于单轮和多轮数据集之间的分布差异,单轮数据集在 CQA 中的改进较少。另一方面,尽管有大量的单轮数据集可用,但我们尚未有效利用它们。为解决这个问题,我们提出了一种将单轮数据集转换为多轮数据集的新方法。该方法包括三个部分,即 QA 对生成器、QA 对重装配器和问题重写器。给定包含上下文和单轮问答对的样本,生成器基于上下文获得候选 QA 对和基于知识图的知识图。重装配器利用知识图获得顺序问答对,重写器以会话角度重写问题以获得多轮数据集 S2M。我们的实验证明我们的方法可以合成用于 CQA 的有效训练资源。值得注意的是,在提交时 (Aug 24th, 2022),S2M 在 QuAC 排行榜上排名第一。