Sep, 2023

对话生成的双层计划抽样

TL;DR本文提出了一种双层预训练采样模型,结合句子级信息和单词级质量,并利用平滑函数将两者的综合结果映射到适当的范围,基于映射值进行概率采样。在 DailyDialog 和 PersonaChat 数据集上的实验证明了我们提出的方法的有效性,明显缓解了暴露偏差问题,并超过了最先进的预训练采样方法。