MMAug, 2019
对图像字幕生成所需的语言单词与视觉语义单位进行对齐
Aligning Linguistic Words and Visual Semantic Units for Image Captioning
Longteng Guo, Jing Liu, Jinhui Tang, Jiangwei Li, Wei Luo...
TL;DR本文提出了一种结合图卷积网络(GCN)的视觉语义单元对象相互作用的图形语义和几何建模方法,利用上下文门控注意力模块将当前单词与视觉语义单元对齐,针对 MS-COCO 图像字幕数据集,与现有方法相比报告了更好的结果。