Apr, 2023

视频聊天字幕生成器:朝向丰富化的时空描述

TL;DR本研究提出了一个新的视频描述方法,即 Video ChatCaptioner,它使用 ChatGPT 模型作为控制器,提出视频内容驱动的问题并回答这些视觉查询,从而生成包含更多视觉细节的视频标题。