从语义潜空间生成对话回复

Oct, 2020

Generating Dialogue Responses from a Semantic Latent Space

Wei-Jen Ko, Avik Ray, Yilin Shen, Hongxia Jin

TL;DR本研究针对现有开放领域对话生成模型无法合理组织多个语义相近的回复而导致生成通用、无信息量的回答的问题，提出在潜在空间上进行回归任务的代替方案，通过学习提示和回答之间的成对关系，使语义相关的句子在潜在空间上靠近。人类评估表明，在连续空间上学习任务可以生成相关且信息丰富的回复。

Abstract

Existing open-domain dialogue generation models are usually trained to mimic the gold response in the training set using cross-entropy loss on the vocabulary. However, a good response does not need to resemble the gold response, since there are multiple possible responses to a given pr

发现论文，激发创造

检索与精炼：用于对话的改进序列生成模型

本研究发展了一种融合了两种不同方法的模型，能够检索出机器人回答，并将其作为附加语境进行精细调节，从而产生了更准确、更生动、更吸引人的回答。在最近的 CONVAI2 挑战评估中，该模型在人类评估中明显优于传统的检索和生成模型。

Aug, 2018

对话系统中选择相应生成知识的学习

该论文提出了一种采用先验和后验知识分布来实现知识选择的端到端神经模型，以更好地将适当的知识整合到响应生成中。

Feb, 2019

PLATO：基于离散潜变量的预训练对话生成模型

本文提出了基于预训练模型的对话生成框架，采用灵活的注意力机制和离散的潜在变量，解决了响应生成中存在的一对多映射问题，并设计了两种互补的任务对话响应生成和潜在动作识别。实验结果表明，该框架在三个公开数据集上验证了其优越性。

Oct, 2019

DialoGPT：大规模生成式预训练技术在对话响应生成中的应用

本文介绍了 DialoGPT，一种大型的、可调整的神经对话响应生成模型，它在 Reddit 上 2005 年至 2017 年的时间跨度内提取的 1.47 亿条对话样本上进行训练。在单轮对话设置中，DialoGPT 能够达到接近人类的性能水平，能够生成比强基线系统更相关、更富有内涵和更具上下文一致性的响应。该预训练模型和训练流程已公开发布，以促进神经响应生成研究和更智能的开放域对话系统的开发。

Nov, 2019

多领域对话行为与响应同时生成

我们提出了一个神经共同生成模型，可以同时生成对话行为和响应，相比于现有的流水线方法，我们的模型可以保留多领域对话行为的语义结构并动态关注不同的对话行为，通过在 MultiWOZ 数据集上的测试，我们的模型在自动评估和人类评估中都比几种最先进的模型表现得要好很多。

Apr, 2020

对话回复生成的多参考训练

该研究工作研究了如何构造多参考训练数据和使用具有表达性先验的 LGM 模型来提高对话模型的生成多对多关系的能力。

Sep, 2020

DialogBERT: 通过学习恢复和排序话语生成具有话语意识的响应

本文提出了 DialogBERT，这是一种新型的对话响应生成模型，通过使用分层Transformer架构和两个训练目标，包括掩码语调回归和分布式语调顺序排名来提高先前基于PLM的对话模型，在三个多轮对话数据集上进行实验证明，相比于BART和DialoGPT，DialogBERT在定量评估方面表现出色，并且在人类评估中证明，DialogBERT比基线模型生成的响应更连贯、信息量更大，并更加接近人类表现。

Dec, 2020

对话响应生成的局部解释

该论文探讨在文本生成任务中模型自主的解释问题，提出了一种新方法——文本生成的局部解释，并表明该方法可以有效地提取输入和输出之间的显式和隐式关系。

Jun, 2021

从沙子中筛选更多的金子：利用有噪声的自我检索生成优化开放域对话训练

通过引入BERTScore提高证据质量，构建retrieval-generation训练框架，利用信息丰富但杂乱无章的对话数据，能使模型生成更好的响应，甚至比扩大培训集带来更好的性能提升。

Jan, 2022

DialogVED：一个预训练的潜变量编码器解码器模型，用于对话响应生成

本文提出了一个新的对话预训练框架DialogVED，使用Reddit进行了预训练，并在PersonaChat，DailyDialog和DSTC7-AVSD数据集上进行了实验，结果表明我们的模型在所有这些数据集上实现了最新的最优结果，其中主要挑战是生成相关且多样化的响应。

Apr, 2022