Sep, 2020

分布式结构化演员 - 评论家强化学习在通用对话管理中的应用

TL;DR本篇论文主要探讨针对特定任务的语音对话系统,重点在于如何通过部分可观察的马尔可夫决策过程来制定对话策略,并以神经网络为函数逼近器的方式,探索深度强化学习算法在对话决策中的应用。