Mar, 2019

使用注意力机制的紧凑型图像标注模型

TL;DR本文提出了一种名为 COMIC 的紧凑型图像字幕生成模型,其嵌入词汇表长度比现有方法小 39-99 倍,但在五个常见的评估指标上在 MS-COCO 和 InstaPIC-1.1M 数据集上达到了与最先进方法相当的结果。