BriefGPT.xyz
Ask
alpha
关键词
image description datasets
搜索结果 - 2
图像文本化:一种自动创建准确详细图像描述的框架
通过结合现有的多模态大语言模型(MLLMs)与多个视觉专家模型,我们提出了一种名为图像文本化(IT)的创新框架,以最大程度地将视觉信息转化为文本,自动生成高质量的图像描述。我们还提出了几个综合评估基准来验证我们框架所创建的图像描述的质量,显
→
PDF
25 days ago
CVPR
使用人类参考数据评估自动图像描述
通过产生更好的数据和寻找替代方法来改进图像描述系统的评估,因为当前的图像描述数据集质量不足。需要更详细的指导方针来考虑视觉障碍用户的需求和生成适当的描述。
PDF
4 years ago
Prev
Next