KDDJul, 2018

使用线性模型 U-Trees 探索可解释的深度强化学习

TL;DR介绍了一种用于 Deep Reinforcement Learning 中 Q functions 的 mimic learning framework,使用 Linear Model U-trees 替代神经网络的 Q function 预测,通过分析特征影响、提取规则和突出图像输入中的超级像素来帮助理解神经网络的学习知识。