CVPRApr, 2021

通过内容多样性探索实现准确的基于文本的图像描述

TL;DR本文提出了一种基于锚文本和锚中心图的多视角多解释图像说明生成方法,以提高生成说明的多样性和准确性。