May, 2019

可理解的基于上下文的文本游戏

TL;DR本文提出了将位置和语法定向结构从文本中提取并使用快速卷积神经网络编码为状态的方法,并以通用和实用的方式增强奖励信号,以加快计算机智能体训练速度和提高其质量。