ACLSep, 2016

基于端到端强化学习的对话代理人信息获取

TL;DR本文提出 KB-InfoBot,这是一个多轮对话代理,帮助用户在不需要编写复杂查询的情况下搜索知识库。通过将符号查询替换为对知识库的感兴趣实体的 “软” 后验分布的较强检索过程,并将其与强化学习器集成,可以在模拟和实物用户上实现更高的任务成功率和奖励。同时,我们还提出了一个完全神经化的端到端代理,其完全是根据用户反馈进行训练,并探讨了其向个性化对话代理的应用。