CVPRMar, 2019
密集关系字幕生成:基于三元组网络的关系字幕生成
Dense Relational Captioning: Triple-Stream Networks for Relationship-Based Captioning
Dong-Jin Kim, Jinsoo Choi, Tae-Hyun Oh, In So Kweon
TL;DR通过引入 “关系字幕” 任务,使用多任务三流网络(MTTSNet)实现 POS 标签指导图像说明的正确顺序,从而提高图像理解能力,相应地,生成更多样化、更丰富的信息表达。