May, 2023

Dior-CVAE: 变分对话生成中的扩散先验

TL;DR提出了一种使用扩散模型产生信息量丰富的先验分布的分层条件变分自动编码器(Hierarchical CVAE),并使用注意机制将生成的潜变量逐层注入解码器,使用记忆丢弃解决后验崩溃问题。实验表明,与基于变分的 Transformer 模型相比,该方法在对话生成方面具有优势。