Jul, 2024

基于图的字幕生成:通过连接区域描述增强视觉描述

TL;DR使用图结构的图像描述方法及其在模型训练中的性能提升