Nov, 2015

从范例中学习简单算法

TL;DR该研究提出一种学习简单算法(如复制、多位数字加法和单位数乘法)的方法,并使用一组接口和神经网络模型来实现,最终证明Q-learning受限于控制器的性能,而非搜索引起的。