Jan, 2019

强化学习中动态物体的运动感知

TL;DR本文研究了动态环境下机器学习控制问题,提出了显式地学习动作表示可以提高学习控制器的质量,在某些情况下不需要额外的监督,通过使用图像差异来替代时序帧堆叠能够取得更好的效果。