Feb, 2017

ViP-CNN: 可视化短语引导卷积神经网络

TL;DR该研究提出了一种以短语为单位进行视觉关系检测的方法——ViP-CNN,通过使用一个短语导向的信息传递结构(PMPS)来同时考虑三个相互关联的识别问题,并通过相应的非极大值抑制方法和模型训练策略来提高检测速度和准确率。实验结果表明,ViP-CNN不仅在速度上优于其他方法,而且在精确度上也表现出较好的性能,在以视觉基因组关系数据集上进行的预训练任务上也比在ImageNet上进行的预训练更加有效。