NIPSJan, 2018

分析一个主动问答机器人所学习到的语言

TL;DR该文章分析了一个被训练使用强化学习的代理程序学到的语言,作为 ActiveQA 系统的组成部分。在这个系统中,问题回答被框架化为一项强化学习任务,代理学习重构用户问题以引出最佳答案。研究发现,代理程序并没有学习与语义相关的转换,而是通过学习传统的信息检索技术(如 tf-idf 重新加权和词干化)来适应回答系统的语言。