Nov, 2022

大规模双向训练的零样本图像描述

TL;DR本文介绍了一种名为 BITTERS 的零 - shot 图像描述框架及数据集评估方法,通过双向图像文本训练以及精细调整提高图像描述精度。