Mar, 2017

一种基于上下文感知的端到端自然语言对象检索方法

TL;DR本文介绍一种通过深度强化学习的方式,结合空间和时间情境及自然语言先验知识,移动和重塑边界框以定位描述中的物体,从而实现自然语言目标检索任务。作者实验表明,该方法在多个数据集上均优于现有算法,特别在 ReferItGame 数据集上,该方法相比 GroundeR 和 SCRC 的准确率分别提高了 7.67%和 18.25%。