NIPSNov, 2017

强化学习任务导向对话管理基准测试环境

TL;DR本文旨在提供用于对话模型开发与评估的一组具有挑战性的模拟环境,其中包括常用的参数算法和非参数算法,并使用公共 PyDial 工具包实现了这些环境和策略模型,以建立一个实验测试平台并促进可重现性的实验。