Sep, 2016

基于深度强化学习的室内场景目标驱动视觉导航

TL;DR本研究解决深度强化学习的一些问题,如模型推理泛化能力差和数据效率低。提出一种策略演员 - 评论家模型,以目标以及当前状态为函数,并在 AI2-THOR 框架下应用模型以与物体交互,实现在 3D 场景中进行大量样本高效收集,易于应用到现实场景并无需进行特征匹配。