Jun, 2016

基于端到端LSTM的对话控制优化-监督学习与强化学习

TL;DR该论文提出了一种用于端到端学习任务导向型对话系统的模型,主要组成部分是一种递归神经网络(LSTM),该网络将原始对话直接映射到系统动作的概率分布中,并且可以使用有目的、强化两种不同方式的优化方法。