Jun, 2024
利用自动回复分割从无标记文档中合成对话
Synthesizing Conversations from Unlabeled Documents using Automatic
Response Segmentation
TL;DR通过学习对话任务数据的分割而不是使用句子边界的分割方法,我们提出了一种强大的对话合成方法,通过该方法生成的合成数据集在机器和人员评估中表现出优越的质量,同时在ConvQA检索系统预训练中使用我们的填充数据,观察到OR-QuAC基准测试数据的显著提升。