Feb, 2018

针对大动作空间的对话系统高效样本深度增强学习

TL;DR本文探究深度强化学习方法解决在口语对话系统的策略优化问题,通过结合多种方法提出ACER算法以显著提高训练效率和应用范围。