Jun, 2019

利用外部信息的信息性图像描述

TL;DR本文提出了使用多模态、多编码器 Transformer 模型将图像信息结合细粒度标签生成信息准确、流畅的图像标注,实现了对实体标签输出的控制,提高了图像描述的准确性和信息丰富程度。