CVPRApr, 2024

视觉事实查证:实现高保真详细标题生成

TL;DR本研究提出了一种名为 VisualFactChecker(VFC)的自动图像描述方法,通过三个步骤,包括提案、验证和描述,生成高保真、详细的 2D 图像和 3D 物体描述,经综合评估得知 VFC 在多个指标上胜过其他开源的自动图像描述方法。