ACLSep, 2022

使用较少的监督学习可解释的潜在对话动作

TL;DR本文介绍了一种用于解释任务对话建模的新型系统,基于离散潜变量表示对话行为。该模型基于变分循环神经网络,无需显式的语义信息。与以前的工作不同,我们的方法分别对系统和用户轮次进行建模,同时执行数据库查询建模,使得该模型适用于任务对话,同时生成易于解释的操作潜变量。我们展示了我们的模型在三个数据集上以较少的监督下在困惑度和 BLEU 方面优于以前的方法,并提出了一种衡量对话成功的新方法,无需专家注释。最后,我们提出了一种关于系统操作的潜变量语义的新方法来解释。