基于注意力语言模型的一致对话

AAAINov, 2016

Coherent Dialogue with Attention-based Language Models

Hongyuan Mei, Mohit Bansal, Matthew R. Walter

TL;DR本研究采用 RNN 型对话模型和动态注意力机制建模了一种连贯的会话延续方法，并通过应用到开放领域和封闭领域的对话数据集进行了评估，结果显示出在多个指标上显著优于基线模型，同时还能通过主题建模进行更进一步的连贯性提升。

Abstract

We model coherent conversation continuation via rnn-based dialogue models equipped with a dynamic attention mechanism. Our attention-RNN l

rnn-based dialogue models dynamic attention mechanism conversation continuation open-domain movietriples dataset closed-domain ubuntu troubleshoot dataset

发现论文，激发创造

利用循环神经网络的对话上下文语言模型

本文提出了一种将对话级别的语篇信息融入语言模型中的上下文语言模型，该模型在 Switchboard Dialog Act Corpus 上表现出比传统单轮 RNN 语言模型更好的性能。

Jan, 2017

具有注意力机制的循环神经网络用于识别中文隐含语篇关系

本研究提出了一种基于注意力机制的双向长短时记忆网络模型，将论述关系的参数组合作为一个联合序列来模拟可以胜过不考虑词序的方法。我们的模型采用了部分采样方案，概念上简单，但是在中文语境的论语树库中取得了最先进的性能，我们还通过可视化其注意力机制的活动状态，说明了该模型在选择性关注输入序列相关部分方面的能力。

Apr, 2017

基于循环注意力模型的神经机器翻译

通过使用一个循环网络来明确地建模词语先前和随后的注意力水平之间的关系，我们改进了 Bahdanau 等人（2014）的注意力模型，并且我们的参数化注意力模型的实验表明其可以提高翻译质量。

Jul, 2016

适用于序列分类的神经注意力模型：分析及其在关键术语提取和对话行为检测中的应用

本文研究探讨了应用于对话行为检测和关键词提取的神经注意力模型在序列分类任务中的应用和作用，并通过实验结果和可视化分析验证了该模型在去除噪音和提取关键信息方面的表现。

Mar, 2016

通过建模、过滤和优化来提高对话的连贯性和多样性

本文介绍了三种增强现有编码器 - 解码器模型的方法，以有效地模拟连贯性并促进输出多样性，它们在 OpenSubtitles 语料库上的实验表明，与竞争神经模型相比，在 BLEU 分数以及连贯性和多样性度量方面均有极大改善。

Sep, 2018

面向神经网络会话模型的有意义注意力

本文提出了一种基于神经网络的方法，模拟了关注和意图过程，并通过三个循环网络实现。该模型在无标注数据的情况下进行端到端训练并能生成自然的响应。

Oct, 2015

利用序列到序列模型生成高质量和信息丰富的对话回复

该文研究应用序列到序列模型解决对话响应生成问题的方法，使用基于注意力机制的解码器保证响应内容连贯性，并提出了一种名为‘glimpse-model’的实用方法以适应大型数据集，并使用随机 beam 搜索算法注入多样性来增加生成可接受响应的比例和整体响应长度。

Jan, 2017

基于注意力机制的语音识别模型

本研究提出了一种基于改进的注意力机制加上位置感知的模型，解决了长输入音频识别中的问题并且有效降低了音素错误率。

Jun, 2015

面向条件序列处理的聚焦分层循环神经网络

提出了使用基于注意力机制的人工神经网络（RNNs）来实现序列建模任务的机制，它允许 RNNs 关注需要的输入的关键部分。通过使用一个多层的有条件序列编码器，读取一个令牌并对其进行离散的决策，来控制信息流入以上层。此方法在几种任务类型上进行评估，包括各种属性的合成任务以及大规模的问答任务，并且相对于已有的基准模型，都得到了一致的性能改进。

Jun, 2018

端到端注意力大词汇语音识别

该研究研究了一种更直接的方法，即使用循环神经网络来替换隐马尔可夫模型，从而在字符级别直接执行序列预测，通过内置的注意力机制自动学习输入特征与期望字符序列之间的对齐。

Aug, 2015