Jan, 2019

永不忘记:通过学习光流实现探索和开发的平衡

TL;DR本研究提出了利用光流估计来评估新观测的新颖性,以解决深度强化学习中高维观测任务下探索和开发之间平衡的问题。实验结果表明,该方法相对于以前的方法具有更优异和持久的性能。