Mar, 2024

考虑 Wasserstein 图匹配的半监督图像描述

TL;DR我们提出了一种考虑 Wasserstein 图匹配的半监督图像描述方法,该方法通过采用原始图像输入来进行生成的句子的监督学习,利用场景图作为中间信息来约束生成的句子,同时结合交叉模态伪监督和结构不变度量,以更有效地使用未描述的图像并学习更合理的映射函数。