Jun, 2024

低资源多领域对话生成的统一数据增强框架

TL;DR我们提出了一种用于多领域对话生成的新型数据增强框架AMD2G,它由数据增强过程和两阶段训练方法组成,域无关训练旨在使模型学习共同的表达模式,然后通过域自适应训练来调整学到的域无关特征到目标域。实验证明,与直接在目标域语料上训练和在所有五个域上进行集合训练相比,AMD2G能够在五个不同领域的中文对话数据集上取得更优异的性能。