Mar, 2023

ChatGPT Asks, BLIP-2 Answers: 自动提问,为丰富的视觉描述添砖加瓦

TL;DR本文介绍一种在图像字幕生成中使用的新型自动提问方法 ChatCaptioner,利用 Prompt 和 BLIP-2 的答案获取新的视觉信息,并比较了 ChatCaptioner 和 BLIP-2 以及真实情况下的结果,结果表明 ChatCaptioner 的字幕在图像信息方面有显着提升,可以感知到比 BLIP-2 更多的对象。