EMNLPNov, 2017

通过负样本短语增强实现开放词汇对象检索和定位的判别式学习

TL;DR本篇研究旨在解决目标检测模型只能处理预定义类的问题,并提出利用文本查询进行目标检索和定位的方法 (Query-Adaptive R-CNN), 通过负向短语扩充 (NPA) 技术训练分类器以检索和定位视觉样本库中的对象,实验表明该方法能在 0.5 秒内从 100 万张图像中准确完成检索定位。