CVPRMar, 2019

密集关系字幕生成:基于三元组网络的关系字幕生成

TL;DR通过引入 “关系字幕” 任务,使用多任务三流网络(MTTSNet)实现 POS 标签指导图像说明的正确顺序,从而提高图像理解能力,相应地,生成更多样化、更丰富的信息表达。