Feb, 2019

DOM-Q-NET:基于结构化语言的基础强化学习

TL;DR本文介绍DOM-Q-NET,一种基于深度强化学习和图神经网络的网页导航新架构。该架构通过将Q函数参数化为不同行动类别的网络,解决了当前深度强化学习模型在网页导航任务中因动作空间巨大和状态之间变化的不确定性等问题的难点。结果表明,该模型在MiniWoB环境中可以达到或者超过现有工作,同时在多任务设置中可以提高2倍的样本效率。