Jan, 2019
永不忘记:通过学习光流实现探索和开发的平衡
Never Forget: Balancing Exploration and Exploitation via Learning Optical Flow
Hsuan-Kung Yang, Po-Han Chiang, Kuan-Wei Ho, Min-Fong Hong, Chun-Yi Lee
TL;DR本研究提出了利用光流估计来评估新观测的新颖性,以解决深度强化学习中高维观测任务下探索和开发之间平衡的问题。实验结果表明,该方法相对于以前的方法具有更优异和持久的性能。