Sep, 2016
基于深度强化学习的室内场景目标驱动视觉导航
Target-driven Visual Navigation in Indoor Scenes using Deep Reinforcement Learning
Yuke Zhu, Roozbeh Mottaghi, Eric Kolve, Joseph J. Lim, Abhinav Gupta...
TL;DR本研究解决深度强化学习的一些问题,如模型推理泛化能力差和数据效率低。提出一种策略演员 - 评论家模型,以目标以及当前状态为函数,并在 AI2-THOR 框架下应用模型以与物体交互,实现在 3D 场景中进行大量样本高效收集,易于应用到现实场景并无需进行特征匹配。