ACLApr, 2018

目标计数!将明确检测返回图像字幕

TL;DR通过利用显式目标检测器提供的语义信息,我们探索了从这些检测中可以得到的各种提示,揭示了端到端图像字幕系统如何使用图像表示匹配生成电影字幕,并揭示了不同对象类别如何在图像字幕中发挥着不同的作用。