Jun, 2015

显式高层次概念在视觉到语言问题中有什么价值?

TL;DR本文提出了一种将高层次的概念融入卷积神经网络和循环神经网络的方法,实现了在图像字幕生成和视觉问答的最新技术性能上的显着提升,并展示了通过引入外部语义信息来进一步提高性能。在此过程中,我们分析了高级语义信息在视觉到语言问题中的价值。