CVPRMay, 2018
基于词性引导的快速、多样化和准确的图像字幕生成
Fast, Diverse and Accurate Image Captioning Guided By Part-of-Speech
Aditya Deshpande, Jyoti Aneja, Liwei Wang, Alexander Schwing, D. A. Forsyth
TL;DR本文提出了一种新的图像描述生成方法,先预测图像的意思概要,再基于该概要生成文本,相比于传统 beam search 的方法,本文方法在文本多样性、计算效率和生成的描述准确性方面都有明显提高。