使用较少的监督学习可解释的潜在对话动作

ACLSep, 2022

使用较少的监督学习可解释的潜在对话动作

Learning Interpretable Latent Dialogue Actions With Less Supervision

Vojtěch Hudeček, Ondřej Dušek

TL;DR本文介绍了一种用于解释任务对话建模的新型系统，基于离散潜变量表示对话行为。该模型基于变分循环神经网络，无需显式的语义信息。与以前的工作不同，我们的方法分别对系统和用户轮次进行建模，同时执行数据库查询建模，使得该模型适用于任务对话，同时生成易于解释的操作潜变量。我们展示了我们的模型在三个数据集上以较少的监督下在困惑度和 BLEU 方面优于以前的方法，并提出了一种衡量对话成功的新方法，无需专家注释。最后，我们提出了一种关于系统操作的潜变量语义的新方法来解释。

Abstract

We present a novel architecture for explainable modeling of task-oriented dialogues with discrete latent variables to represent dialogue actions. Our model is based on →

explainable modeling task-oriented dialogues discrete latent variables variational recurrent neural networks database query modeling

发现论文，激发创造

无监督对话结构学习

通过使用改良后的 VRNN 模型和离散潜在向量来提取对话结构，我们的方法在预测未见数据方面具有优异性能，并在加入对话结构后的奖励功能设计实现了更快的强化学习收敛和更好的结果。

Apr, 2019

通过变分自编码器实现潜在动作空间，用于对话策略优化的 LAVA

本文探索使用辅助任务来塑造潜变量分布的三种方式，并选择响应自编码为辅助任务，以获得更具行动性质的潜变量表示，从而支持端到端对话策略优化，并实现最先进的成功率。

Nov, 2020

可解释性神经对话生成的无监督离散句子表示学习

本研究利用变量自编码器 (VAE) 算法提出 DI-VAE 和 DI-VST 模型，结合无监督离散语句表示学习方法，以增强对话模型的解释性生成能力，并成功验证其在真实对话数据集上的有效性。

Apr, 2018

基于潜变量模型的端对端对话代理强化学习中的行动空间重新思考

该研究提出了一种新颖的潜在动作框架，将端到端会话代理的动作空间视为潜在变量，并开发无监督的方法从数据中诱导其自己的动作空间。实验结果表明，所提出的潜在动作在 DealOrNoDeal 和 MultiWoz 对话上实现了比以前的基于单词级策略梯度方法更好的实证绩效改进。

Feb, 2019

一种分层潜变量编码器 - 解码器模型生成对话

提出一种基于神经网络的生成架构，通过潜在的随机变量来建模具有复杂依赖关系的分层结构顺序数据，将该模型应用于对话响应生成任务并与最近的神经网络架构进行比较，实验证明该模型可以提高生成长输出的准确性并维持上下文信息。

May, 2016

潜在意图对话模型

这篇论文提出了一种使用离散潜在变量来处理自然语言对话场景的深度学习模型，通过使用强化学习进行自动学习和提高表现，相对于传统方法，其能更准确地捕捉自然交互变异性，可广泛应用于人工智能领域。

May, 2017

利用解释作为潜在变量实现可解释的自然语言理解

本文提出了一种可解释自然语言理解的框架，使用一小部分人类注释的解释进行训练，并采用变分 EM 方法进行优化，同时提出了基于解释的自训练方法，在两个自然语言理解任务上进行实验，证明了该框架不仅可以在监督和半监督设置下进行有效的预测，还可以生成良好的自然语言解释。

Oct, 2020

PLATO：基于离散潜变量的预训练对话生成模型

本文提出了基于预训练模型的对话生成框架，采用灵活的注意力机制和离散的潜在变量，解决了响应生成中存在的一对多映射问题，并设计了两种互补的任务对话响应生成和潜在动作识别。实验结果表明，该框架在三个公开数据集上验证了其优越性。

Oct, 2019

战略对话的分层文本生成与规划

本论文介绍了一种学习对话信息表征、提高决策效率的方法，通过解耦对话表述中的语义和语言实现，使用学习到的表征完成对话生成、规划和增强学习等任务，在实验中效果比之前的工作更佳。

Dec, 2017

一种用于语篇关系语言模型的潜变量循环神经网络

本文提出了一种新颖的潜变量循环神经网络架构，用于同时建模词序列和相邻句子之间的（可能潜在的）言语关系。它通过循环神经网络生成单个单词，并可以使用潜在变量表示言语关系。该模型可以使用既包括言语关系分类又包括词预测的训练目标，从而优于最先进的替代方案，它可以用于隐含语篇关系分类以及对话行为分类。在测试时间通过潜在言语关系求和，我们获得了一个获得语篇的语言模型，从而改进了一个强大的 LSTM 基线。

Mar, 2016