CVPRMay, 2018

基于词性引导的快速、多样化和准确的图像字幕生成

TL;DR本文提出了一种新的图像描述生成方法,先预测图像的意思概要,再基于该概要生成文本,相比于传统 beam search 的方法,本文方法在文本多样性、计算效率和生成的描述准确性方面都有明显提高。