Jun, 2017

广义价值迭代网络:超越格子世界

TL;DR该论文介绍了一个称为 GVIN 的神经网络规划模块,利用图卷积算子模拟价值迭代算法,并提出了三种不同可微分的卷积核,其中基于嵌入的卷积核表现最佳,进而提出了改进型 Q 学习,用于网络训练的稳定化。实验结果表明,GVIN 在二维迷宫、不规则图形和真实街道网络的规划问题上表现出优秀的泛化性能。