Dec, 2017

序列决策的结构权重不确定性学习

TL;DR本文提出了在SVG框架内通过采用矩阵变量高斯先验对NN参数进行有效的结构权重不确定性后验学习的方法,并进一步研究了顺序决策问题中的学习到的结构不确定性,包括上下文三臂强化学习和强化学习。在几个合成和实际数据集上的实验证明了我们模型相对于最先进的方法的优越性。